首页 科技 正文

印度Kaggle告诉我:我是怎么拿到四大类特级大师的?

杨净 只想说 凹非寺量子位 报导 | 微信公众号 QbitAI

Kaggle高手是怎样练成的?

近期,一个印尼裔Kaggle高手在社区论坛上共享了他得到 4个类型的Grandmaster的历经。

嗯,一共就仅有四种。

能够见到,他的金牌数量加起來就会有84枚,在其中Discussion上得到 了56枚,数据集这一类其他排名术最大,在27466个参赛选手中位居第7位,最大排名为第六位。

在Competitions里,他共得到 了4枚單人金牌和4枚精英团队金牌。

因此,他就发布了一篇博闻追忆了以往一些印象深刻的新项目,并谢谢Kaggle给他们那样一个服务平台:

我时断时续在Kaggle上跑了七年,这简直一段旅途。Kaggle不仅是网址或比赛。针对喜爱计算机科学和深度学习的人而言,它是一生的历经。

此外,他還是一个数独发烧友,数次得到 我国冠军,最大排名第八。

4个Kaggle Grandmaster的历经

最先是Competitions。

过去七年中,他共完成了56场赛事,他的最大考试成绩是4枚本人金牌和4枚精英团队金牌。

在其中Santander、ASHRAE这好多个金牌新项目令他印象深刻。

Santander Product Recommendation,桑坦德商品强烈推荐。(桑坦德,意大利的一个金融机构)

这一挑戰中,主要是依据顾客以往的个人行为及其相近顾客的个人行为,来预测分析目前顾客下月将应用什么商品,从而将商品与人来搭配。

最后,现有1779支团队报名参加,而他与另一位大数据工程师协作@sudalairajkumar,排序第11位,摘到他第五枚金牌。

也有像ASHRAE,预测分析建筑将耗费是多少动能?Rossmann Store Sales,运用店铺营销、竞争者来剖析市场销售状况这些。

作者觉得,它是唯一具备实际意义的積分排名系统软件类型。他期待能够变成Kaggle之外的国家标准,使其更具有使用价值。

随后是Datasets。

作者表明,为数据集争得网络投票是最具趣味性每日任务之一。

因而,他就以对终端产品用户最有效、更为结构型的文件格式来提前准备数据集,并多方面尽量多的关键点叙述。

一些让人印象深刻的数据信息有这种:

印尼的空气指数:作者花了100钟头来归纳、清除和提前准备这一数据集。Chai Time Data Science Show(对ML权威专家的访谈综艺节目)每一集的数据统计;

女特等高手的象棋赛事(2009-今年)。嗯,象棋是作者的最喜欢。但是,在他公布的18个数据集之中,我还是发觉了一些趣味的数据集。

例如,拜登的从二零零七年-今年数据信息twiter数。

SpaceX的数据信息(2006-2020)。

也有Notebooks。

在赛事完毕以前,作者是不容易看公共性EDA Notebook。一般是在进行自身深层EDA后再看他人的工作中。

依照那样的方法,他就得到 了15枚金牌,4枚金牌及其6枚奖牌,做到高手等级。

但是,他也感慨道,用Macbook Air赢得比赛的生活早已一去不复返了,但为什么说不容易再试着了呢。

最终也有,Discussions。

做为喜爱沟通交流的他,除开得到 之上考试成绩以外,他还对小区一些提议,

小区根据贴子的净网络投票来优先选择解决有效的探讨,并过虑掉废弃物信息内容,这一点做得非常好。希望Datasets和Notebooks也可以容许往下拉网络投票,不被有所差异。

今年亚洲地区数独公开赛金牌获得者

来介绍一下作者本作——Vopani,真实姓名称为Rohan Rao,来源于印尼,是H2O.ai的大数据工程师,毕业于印度孟买理工大学应用统计学技术专业。

而H2O.ai是一家创立于二0一二年,总公司坐落于美国硅谷的开源项目公,该企业有着一个计算机科学和深度学习的开源平台H2O。据了解称,一半的世界五百强企业都会应用这一服务平台。

此外,他還是一个数独发烧友。

他曾得到 7次全国各地数独冠军,5次全国各地拼图图片类冠军,4次世代数独我国冠军,今年亚洲地区数独公开赛金牌获得者。

现阶段数独全球排名在第23名,最好考试成绩到过第八名。

果真,成功的人一定不只一个地区出色。

好啦,因此 你身旁有木有碰到Kaggle高手的历经,热烈欢迎与大家共享。

非特殊说明,本文由原创资讯网原创或收集发布。

转载请注明本文地址:http://www.68nw.com/kj/1661.html