当前位置:百乐门 > 互联网科技 > 纵深学习正在让客商隐秘成为交际巨头的摇钱树?

纵深学习正在让客商隐秘成为交际巨头的摇钱树?

文章作者:互联网科技 上传时间:2019-11-06

原标题:Facebook 利用 AI 识别表情包里的不当内容

图片 1

图片 2

北京时间9月12日,Facebook宣布开发出一款新型人工智能系统,可用于检测仇恨性言论。美国科技媒体CNET认为,这款“武器”的推出可谓恰逢其时,在Facebook面临内容审查的当下,会大有用处。这一系统的代号为“Rosetta”,可帮助计算机阅读和理解每天发布到社交网络的数十亿张图像和视频。凭借这套新系统,Facebook可以更容易地发现平台上哪些内容违反了反仇恨言论规则。

福布斯近日撰文介绍了Facebook利用深度学习技术来全面了解用户的四种令人惊叹的方式,它们分别是文本分析、人脸识别、定向广告和设计AI应用程序。

Facebook 的审查人员无法审核人们在平台上发布的每一张图片,因此 Facebook 希望通过人工智能来帮助他们。在一篇博客文章中,Facebook 介绍了一个名为 Rosetta 的系统,它可以利用机器学习来识别图像和视频中的文本,然后将其转录为机器可读的内容。特别地,Facebook 发现这个工具有助于在表情包上转录文本。

通常情况下,计算机使用一种名为光学字符识别的方法来识别图片或视频中的内容,但是,由于Facebook网信息庞大——每个月有22亿人使用该社交网络——OCR的缺点暴露无遗。因此,Facebook宣布建立一套更大规模的系统。该系统同时适用于Facebook和Instagram,还可用于改进照片搜索和新闻流的表面内容。Rosetta通过从十多亿个图像和视频帧中实时地提取不同语言的文本,对网站内容实施监测。

近年来,媒体对机器学习、深度学习等人工智能技术进行过不少的基本介绍。展开相关研究的企业也不在少数,那企业们实际上又是如何应用它们的呢?

文本转录工具并不是什么新鲜事,但 Facebook 却面临着不同的挑战,因为其平台量级巨大,以及其上的图像种类繁多。根据官方说法,Rosetta 现在已经上线,每天会从 Facebook 和 Instagram 上抓取 10 亿个图像和视频帧文本进行转录。

随着Facebook在社交网络上对内容进行审查,这套系统肯定会派上用场。此前,Facebook网曾被指责对缅甸、斯里兰卡和印度的暴力事件负有一定责任。上个月,该社交网络表示,由于在Facebook平台发现虚假信息,该公司正在采取行动,阻止缅甸的“仇恨传播”,截止到目前,鉴于缅甸国内针对罗辛亚穆斯林的种族暴力仍在继续,Facebook已删除了18个帐户和52个与缅甸军方有关的网页。

Facebook是通过了解它的用户和为广告主“包装”用户数据来展开业务的。而它从业务运营赚到的钱会重新投入到给用户提供有用的新功能,目前来说主要是提供视频和购物功能。接着,它还会利用这些功能服务来进一步了解用户。

目前还不清楚 Facebook 正在对这些数据进行怎样的处理。文章指出,这对于照片搜索和屏幕阅读器等基本功能非常有用。但看起来 Facebook 也开始把它放在更大的目标上,比如弄清楚什么样的内容更吸引人,更重要的是,可以找出哪些表情包、图片或视频中存在仇恨、侮辱等不当言论。

今年7月,Facebook表示将开始删除旨在煽动或加剧暴力的虚假信息,包括书面帖子和受人操纵的图像。此前,Facebook只禁止直接调用暴力内容,当前的新政策还涵盖有可能激起身体伤害的假新闻。

随着该社交网络带给人们的通讯和对话交流方式被证明对我们很有价值,它成为了能够吸纳海量用户数据的“磁石”。那些数据涉及用户是谁、他们如何花费时间、他们喜欢什么等信息。对于Facebook从事数据挖掘工作的数据科学家们来说,挑战在于那些数据大部分都非常散乱,属于非结构化数据。

Facebook表示,文本提取和机器学习正在被用于“自动识别违反我们的仇恨言论政策的内容”,而且该系统还支持多语言。鉴于 Facebook 众所周知的内容审核问题,一个能够自动标记可能有问题的图像的功能,对于 Facebook 来说应该会很有用。

上周,Facebook首席运营官雪莉·桑德伯格和Twitter首席执行官杰克·多尔西一起到国会作证,就公司为保护用户而设立的内容审查政策和安全措施进行阐述。

图片 3

Facebook 利用 AI 识别表情包里的不当内容动点科技。返回搜狐,查看更多

Facebook的首席执行官马克·扎克伯格过去经常说,正在寻求利用人工智能技术,以便积极主动地检测平台上令人讨厌的内容,而不是等待人们去标记举报。但是当该公司开发这项技术时,他又说,社交网络正在雇用两万名人类主持人来监管平台上的有害信息。此外,Facebook星期二还表示,正在向自动翻译工具集添加新的语言。新近增加的24种新语种包括豪撒语、乌尔都语和尼泊尔语,至此,翻译语言总数已超过125种。

虽然Facebook平台上12亿用户每分钟上传的照片数量达到13.6万张,更新的状态数量达到29.3万,但直至最近,Facebook只能够寄望从它少量的非结构化数据(不易被量化和放入图标进行计算机分析的信息)当中挖掘价值。

责任编辑:

文章来源:新浪科技

深度学习正在帮助解决这一问题。深度学习技术使得机器能够自行归类数据。一个简单的例子就是,深度学习图像分析工具懂得学习识别含有猫的图像,不需要被告知猫长得什么样。通过分析大量的图像,它能够从图像的背景学习到信息——如还有什么东西可能会出现在猫图中?什么文本或者元数据可能暗示图像含有猫?

通过进行量化,以及方便分析工具获取深刻见解的形式呈现数据,这有助于结构化非结构化的数据。Facebook的研究者尝试回答这样的问题:公司的产品多经常出现在有猫的图像当中?我们是否该专注于向喜欢猫的人展示我们的广告吗?

那一基本原理解释了为什么深度学习对Facebook有用,随着深度学习算法变得更加先进,它们能够被应用于更多我们所分享的数据,从文本到图片再到视频。

本文由百乐门发布于互联网科技,转载请注明出处:纵深学习正在让客商隐秘成为交际巨头的摇钱树?

关键词: