集智专栏
资源加载中,请稍后...
集智专栏

世上最大的不可描述网站也向AI和机器学习势力低头。

原文:《Pornhub is improving search with an AI porn addict》

翻译:小马哥

编辑:船长


常规的不可描述网站在 UGC(用户产生内容)方面往往都面临着一个大麻烦,那就是用户在上传视频的时候常常不会按照数据库的正常方式操作。

就算设计产品时已经把用户想象成傻子,还是会有出人意料地傻的用户出现就算设计产品时已经把用户想象成傻子,还是会有出人意料地傻的用户出现

这样就带来了一个问题:每当你打开网站,映入眼帘的就是千上万个视频,虽然全都使用了简单词汇和标签描述内容,但内容往往重复。这就给用户在搜寻视频资源时造成了很大困扰,尤其是当你有特殊♂癖好,或者当你突然很想看某个特定的演员的作品时,比如最近听说有新作即将发布的明日花老师。

如果一部解决不了你,那就再来一部。如果一部解决不了你,那就再来一部。

为了解决这个问题,世界最大不可描述网站 Pornhub 计划利用人工智能技术将网站目录里的全部视频逐帧扫描和整理。

这套AI系统从成人演员身上采集了数千幅画面和动作,以此构建了一个数据库,含有人物名字、面部特征和开车姿势等信息,然后将收集到的数据和 Pornhub 系统中的视频片段相比较,从而对网站视频库中庞大的视频资源自动标记和分类。

唐马儒再次面临失业危机唐马儒再次面临失业危机

更加令人侧目的,是超越传统意义上的“标签”功能,系统会利用 CV 技术识别屏幕上任何时间点人物的名字以及任何姿势,在 Pornhub 为科技媒体 Engadget 的演示中,演员边以某种姿势开车,屏幕上就会浮现相应的标签,比如“咬”“牛仔女郎”“传!教!士姿势”等。此外,系统甚至还能识别出演员是不是金发,是在室内还是室外,然后添加上相应的标签。

当初求种像条狗的悲剧再也不会重演了,按标签顺藤摸瓜就可以当初求种像条狗的悲剧再也不会重演了,按标签顺藤摸瓜就可以

在此套 AI 系统正式上线前 Pornhb 对视频分类的方式还是由人力来完成。Pornhub 希望在不远的将来,用户能够观看由其AI智能系统分类和标记后的视频。届时,假如你很想看某个成人演员的作品,AI 系统就会把所有它认为有这个演员演出的视频片段展示给你,而且还会显示此演员演出的百分比。

Pornhub 同时也会请求用户帮助训练 AI 系统,比如赞同正确的展示,反对错误的展示,使其逐步完善,准确度越来越高,想必没有人能够拒绝这个请求。

Pornhub AI系统工作方式:

  1. 从成人演员图像中获取数据
  2. 去除错误和模糊图像
  3. 训练机器学习模型
  4. 将模型在站内视频库中运行
  5. 通过反馈来优化和改进学习模型

迄今这套系统已经扫描了大约 50 万部视频,但 Pornhub 希望能在 2018 年初之前完成对所有视频资源的扫描和标记工作。(还是别让唐马儒上了,估计会死)

Pornhub 最终希望能给用户提供多种形式的产品,无论他们有什么样的嗜好,采用的新系统都能为用户展示更准确的结果,提高用户的回访率。Pornhub 认为用户搜索和找到资源越容易,他们的愉♂悦♂感就越高。

不过与此同时,人脸识别技术也引起了人们对隐私问题的担忧。一些报复性的视频常常会被上传至某些知名的不可描述网站,还有些人发布了自己的视频但想保持匿名。对此 Pornhub 称他们采用的系统绝对没有任何用户隐私方面的隐患,因为软件仅识别数据库中的知名成人演员的脸部数据,不会识别非从业者,而且如果演员戴着面具或者脸部模糊不清的话,软件就无法识别。这样以来,一些戴着面具或者想保持匿名的演员的真实身份,外界就无法知道了。

尽管上述这一系列操作听起来有点变态,但是 Pornhub 的 AI 系统本身的确功能强大。比如它还能发现和矫正人类操作造成的错误。

Pornhub 利用该系统可以发现低质量的重复视频和一些资源的浓缩版,然后删除。当然了,它最厉害的地方在于能够利用 CV 技术,自主学习怎样有效地自动识别和标记视频,并添加描述内容。通过 AI 系统和机器学习,Pornhub 相信能够提供更好的搜索体验、更高质量的视频和更少的重复资源。

您也许喜欢这些文章

人脸识别的下一挑战:识破蒙面人

发表至业界新闻
人脸识别应用日渐普及,很多人也会想到规避监控,但问及方法,大家都说:很简单,戴个面具不就行了。这个办法现在虽然管用,以后可能就不好使了。人脸识别技术的一个发展方向就是识别蒙面人——也即是说,想在光天化日之下还真人不露相,会越来越难。

深度学习带你抠像表演

发表至数据科学
“抠图”是PS中最常用的技巧,但也颇费工夫。除了静态的图片,目前很多影视剧中也应用了抠图技术配合出演。需求如此之大,当然会有人想到用AI来自动化、批量化,深度学习正是最流行的解决方案,本文介绍了利用深度神经网络进行程序化抠像的知识和应用案例。

文章评论(1)