当你还在实验室琢磨几十万网页的分类器,当你还在网上苦苦搜寻那几千几万条的公开测试集,当你的论文把百来万条记录称做“大数据上的科研”……

  同学们,save your time, 放过那些tiny data,让阿里告诉你,什么叫做big data。

  阿里巴巴大数据竞赛——天猫推荐算法大挑战,给你真实的数据,解决真实的问题。百万大奖,等你挑战。报名时间:3月10号—4月20号,赶紧报名吧!

  详情猛戳:http://102.alibaba.com/competition/addDiscovery/index.htm 


附件:大赛介绍】

一、大赛背景介绍:

随着大数据的蓬勃发展,阿里巴巴集团提出了“平台、金融、数据“的三步战略,把“数据分享平台”作为战略目标,并且逐步推进数据开放之路。

阿里巴巴集团希望和学术界展开更紧密的合作研究,更好的发掘大数据的价值。针对当前学术界面临的两个问题,一是缺少有价值的真实的商业数据 ;二是缺少具有强大功能的计算平台支持复杂的数据处理。阿里巴巴集团将于2014年正式推出“天池”平台,“天池”平台基于阿里集团的海量数据离线处理服务ODPS,向学术界免费提供科研数据和开放数据处理服务。

2014年,阿里巴巴集团将基于“天池”平台,在全国高校启动阿里巴巴大数据竞赛(AliData Discovery),以天猫推荐算法大挑战为主题,为更多高校学子提供大数据的实战机会,推动高校对大数据和算法的研究发展和人才成长。

本次大赛的赛题是“天猫推荐算法“, 赛题基于真实的商业实战场景,在天猫每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌推荐算法的优化可以为消费者、品牌和天猫平台带来更大的价值。天猫提供的数据量,涉及千万级天猫用户,上万个天猫品牌,时间跨度4个月、共计5亿多条的行为记录。参赛者需要根据用户在天猫的行为日志,建立用户的品牌偏好,并预测他们在将来对品牌下商品的购买行为。

 

二、赛制介绍:整个比赛分为三季(season)
Season 12014年3月10日至4月20日,参赛者可以下载少量天猫的真实行为数据,并在本地调试算法,提交结果。 
Season 22014年4月25日至7月30日,参赛者须使用“天池”平台(阿里巴巴自主研发的分布式计算平台),访问海量的天猫数据,并利用Map&Reduce、SQL及各种平台集成的机器学习算法包调试模型、提交结果。 
Season 3(即线上赛,实战双11):2014年10月至11月,Season 2的top选手可以访问天猫,参与2014年双11的真实算法设计,并有机会获取百万大奖。

 

三、奖项设置:

Season 1阶段不设奖项

参赛队伍中成绩Top500的队伍直接晋级Season 2 
Season 2 
阶段奖项:

一等奖:1支队伍,奖金贰拾万 
二等奖:1支队伍,奖金伍万 
三等奖:1支队伍,奖金贰万 
(上述奖项以决赛答辩成绩的最终名次决定)

月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部(具体手机型号在公布榜单时公布) 
优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段) ,在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书 
总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年

Season 3 线上阶段奖项:

Season 2 阶段的Top3队伍将受邀参加天猫双十一实战,赢取100万大奖。(组委会将在Season 2结束后公布细则)