集智专栏
资源加载中,请稍后...
集智专栏

Google首款小程序「猜画小歌」用了哪些AI相关技术?

船长

参考资料


这两天,谷歌推出的首款AI小程序“猜画小歌”彻底火了,朋友圈一时成为灵魂画师们的舞台。大体来说,就是你和AI玩一个“你画我猜”的游戏,你在屏幕上画个涂鸦,AI会猜测你在画什么。至于游戏规则和玩法,其他答主已经介绍的非常详细了,这里不再赘述。

图片来自TechCrunch图片来自TechCrunch

其实这款产品并非谷歌首次推出,它的原型是谷歌在2016年11月发布一款叫做Quick,Draw!的网页版小游戏,当时集智专栏也分享过:来自Google的小游戏,让任何人都能参与到机器学习中来

Quick,Draw以及这款“猜画小歌”比较类似于前几年很火的手机游戏你画我猜,但不同的是,Google在这两款游戏中为用户安排的对手不是人类,而是人工智能。

在Quick,Draw!画板上画出一个涂鸦后,AI会随时给出它的猜测结果,当完成六次游戏后,系统会给出一个总览图,你可以点击每一幅图片来观察AI的识别结果并浏览其他人的绘制结果。

集智君玩耍Quick,Draw!的结果

网站传送门

这两款游戏的本质其实就是一个图像识别分类过程,系统通过清洗、分析图形的特征,来判断图形的真正含义。谷歌在发布Quick,Draw!之初时,分享过一个视频,介绍了这款游戏的成型过程,可以帮助大家更形象的理解它背后的技术原理:

图像识别技术一直是人工智能的一个重要组成内容,也是Google一直努力的研究方向之一,性能良好图像识别模型具有重要的实用功能,可以广泛地应用于图片检索、媒体内容归类、视频监控等多个领域。

当然训练好这样的人工智能并不容易,谷歌在介绍“猜画小歌”时提到,Google AI 的神经网络驱动。该网络由全世界最大的、囊括超过 5000 万个手绘素描的数据集训练而成。去年8月份时,谷歌专门做过关于这个数据集的介绍,当时集智也做了分享

这个庞大的数据集是由1500余万用户在玩耍Quick,Draw!时和机器互动的过程中得来,目前收录了5千万幅涂鸦作品。谷歌已经将该数据集开源,将这些涂鸦画作整理为开放数据集(后面会扩充为8亿幅作品),旨在帮助全世界的开发者能用它训练神经网络,用来做数据分析、产品设计,帮助研究者们研究全球各地人们的绘画习惯,甚至帮助艺术家创作新奇的作品···

有这方面需求的朋友,不妨去看看,数据集地址

数据集所在的GitHub仓库中也包含了有些开发者自己实现的Quick,Draw!模型,对于想复现这种技术的朋友来说很有借鉴意义,不要错过。

话说回来,和玩Quick,Draw!一样,我们在玩“猜画小歌”的同时,也在帮助AI成长。在Quick,Draw!发布之初时,它只使用了数百个训练数据,系统识别率并不理想,但经过后续多达千万个用户的参与和玩耍,多达几亿幅涂鸦作品帮助AI学习后,系统的识别率已经相当好,而且能识别出不同形态的同一物体(比如说对于宽檐帽和鸭舌帽的图形,系统均能准确地识别出是“帽子”)。

其实,这种人工智能的意义也绝非识别人类涂鸦和我们玩玩游戏这么简单。例如通过全球用户在Quick,Draw!上和AI的互动,我们就能发现不同国家的用户在认知角度与偏好上的差异,进而能了解全球各地用户在描绘事物时的审美观差异。通过这样AI就能为我们的产品和应用在不同国家和地区的本地化做出有意义的指导,比如网站和App的UI该如何设计。

AI在学习人们的涂鸦姿势和习惯后,甚至还能帮我们画画,比如谷歌在发布Quick,Draw!后不久,就在它基础上推出了一款叫做AutoDraw的绘画机器人,能将你的涂鸦自动升华为美丽的艺术图像。设计师朋友们想想看,以前需要自己用软件费时费力设计的图形,现在按大概模样随便涂涂画画后,AI就能自动帮你转化为需要的结果,如此省时省力,岂不美哉?

AutoDraw效果示意图AutoDraw效果示意图

另外,通过识别和学习人类的绘画书写习惯,训练后的AI还能帮助警方破案!比如今年的ICFHR18大会上收录了一篇叫做《A New COLD Feature based Handwriting Analysis for Ethnicity/Nationality Identification》的研究论文,研究人员在收集五个国家公民的手写字体后对其进行了分析,然后用这些数据集训练了一个机器学习模型,能够通过识别字迹确定书写人的国籍。

研究人员随即选择了 100 名来自马来西亚、伊朗、中国、印度和孟加拉国的被试者,让他们手写同样的英文,然后使用一种线性分布(COLD)识别工具分析他们所写字体的形状分布特征,如直线度、弯曲度等。

AI在分析不同国籍人员的书写习惯AI在分析不同国籍人员的书写习惯

结果显示,即使不是书写该国文字,被试者的笔迹也呈现出明显的“国籍”特征。因为这是文字造就的书写习惯不同,即时换为书写另一种语言同样潜意识的保留了它们。例如,习惯汉字笔直笔画的中国人,即使是手写罗马字母,也不会改变直线书写习惯;而文字比较“圆润”的印度和孟加拉国,他们写出的字体则更“圆”。所以,假如案件中出现跨国嫌犯,物证中存在嫌犯留下的笔迹,AI就能分析出嫌犯的国籍。

随着训练数据越来越多、越来越广,人工智能会带来更多像这样的创新成果。

当然,Quick,Draw!以及“猜画小歌”最直接的意义是以游戏的方式让大众参与到机器学习过程中,从而让人工智能技术变得触手可及,人人都能上手体验AI的乐趣。

其实谷歌一直以来都有一个很好的传统,就是将其掌握和正在研究的各类项目转化为有意思的小实验来让普通用户体验和测试,比如包含Quick,Draw!小游戏的项目AI Experiments。

AI Experiments绘画部分的小实验AI Experiments绘画部分的小实验

网站上面汇集了很多有意思的小实验,题材涵盖绘画、音乐和语言多个方面,让普通人也能轻松探索机器学习的世界。传送门

通过这些小游戏和小实验,让普通大众也能领略最新的人工智能技术,不失为一种富有创造力的方式。

最后附一个我们此前分享过的AI Experiment小实验,让你在浏览器上就能玩耍机器学习,理解神经网络的学习过程,很好玩,不要错过


限时折扣中:0806期《人工智能-从零开始到精通》(前25位报名同学可领取¥200优惠券)

您也许喜欢这些文章

集智专栏

两分钟论文解析184:DeepMind自主学得音视频概念

发表至业界新闻
来自YouTube的《Two Minute PAPERS》系列,该系列视频在极短的时间浓缩介绍新近科研论文的成果,本篇(第184期)讲的是DeepMind的最新成果,用无监督的方式让算法自主学会了匹配声音和画面中的乐器。
集智专栏

极简增强学习新手教程

发表至趣味项目
介绍“增强学习”的基本概念、问题解决框架,并展示喜闻乐见的实例。
集智专栏

我家的AI才不会这么智障——DeepMind让人工智能学会如何走路

发表至业界新闻
通过深度增强学习,我们现在可以从零开始让人工智能自动学会识别物体、行走运动甚至于推理演绎等等。得益于相关训练工具的完善,我们还可以通过三维图像直观地看到AI的学习过程以及学习结果。DeepMind的工程师们这次就为我们带来了一段很有意思的视频,视频中他们试图训练人工智能完成「行走」这一动作,最终AI也很好地完成了任务,只是——好像动作有点不雅观呢。

文章评论(0)