您当前的位置: 首页 > 汽车

谷歌开放QuickDraw数据集8亿世界各国人民的涂鸦都在这里

2018-11-26 09:58:14

昨日,谷歌开放了其语音命令数据集,开发者可借助它搭建基础的语音交互应用。

今天,好消息又来了:谷歌再次宣布开放一个全新的绘图数据集,它的来头可不一般:

还记得谷歌去年底发布的 AI 涂鸦游戏Quick, Draw! 吗?

这个游戏会弹出对话框,让玩家在 20 秒内草绘一样物体,然后利用其机器学法算法对该物体进行识别,对玩家画得到底是什么给出猜测。感兴趣的小伙伴可点击这里体验。

Quick, Draw! 的本意,是谷歌的教育体验项目,帮助公众认识神经网络——比如它能做什么。设计它的谷歌工程师团队希望让大家意识到,人与机器学习系统交互也可以充满趣味性。而显然,设计者的目的已经完美达成。

自 Quick, Draw! 上线伊始,便吸引了世界各地的人们上手尝试。过去的六个月里,各国玩家在Quick, Draw! 上进行的涂鸦,逐渐形成了一个相当庞大的数据集:

根据雷锋网(公众号:雷锋网)获得的数字,来自 100 个国家的 2000 万用户,在Quick, Draw! 上共绘制了 8 亿幅涂鸦。

今天,谷歌宣布把该数据集开放出来,供全世界的数据科学家、设计师进行分析,或许能够从人们直觉性的涂鸦中获得产品设计思路。

目前,该数据集共包含 5000 万张涂鸦。谷歌表示,剩下的 7 亿多张会陆续发布。

谷歌表示:

“这不但是海量的数据,还是一面有意思的镜子——能借此透视怎么以众包的形式让公众参与训练机器学习系统,以及如何创建一个能反映不同文化背景与观念的数据集。”

的确,谷歌根据用户的国籍进行分组,在Quick, Draw! 数据集中发现了不少有趣的现象。比如,不同国家人脑中的“椅子”:

韩国和俄罗斯用户脑中,直觉性的椅子图像是侧放的,而美国、德国、巴西、南非都是正面放置的。

谷歌表示,Quick, Draw! 为研究如何避免人工智能系统对文化、种族、社会群体产生 bias(倾向),提供了非常好的研究素材。对这个话题感兴趣的读者可访问谷歌博客。

Quick, Draw! 数据集的 GitHub 地址:

雷锋网版权文章,未经授权禁止转载。详情见转载须知。

推荐阅读
图文聚焦