科学家在谷歌,与斯坦福大学合作,创建了人工智能软件,拥有世界上最先进的图像识别技术。
软件能够描述照片的内容比任何其他软件。事实上,它的描述是类似于将由一个人。
“这种系统可能最终帮助视力受损的人理解图片,提供替代文本图像在世界各地的移动连接是缓慢的,并使每个人都更容易在谷歌上搜索图片,”说谷歌在一份声明中。
虽然新系统是复杂和使用算法非常详细,也输出语言,很容易理解。它使用两个网络。的一个网络处理实际图像识别和其他处理自然语言处理。不仅如此,该系统是计算机学习,这意味着它的美联储的标题图片,最终学习这些标题与图片。例如,图像左边是所描述的软件作为“两个披萨炉前炉之上。”According to the team behind it, the system is twice as advanced as any similar software.
尽管如此,软件不是100%准确。它偶尔犯错误或在它的描述是错误的。团队正在继续开发软件,虽然很明显,但它开始以来已经走过了漫长的道路。
“我认为图片和视频的像素数据是互联网的暗物质,”说菲菲,斯坦福大学人工智能实验室的主任。“我们现在开始照亮它。”
最终这项技术可能导致使盲人和机万博体育登录首页器人更好地舒服地浏览他们的环境。然而,它也可以用于监测。在过去的几十年里成百上千的监控摄像头被放置在两个公共和私人的地方。最终这个软件能识别个人面孔和某些类型的行为。
这个消息是两年之后谷歌创建不同的图像识别软件,它从YouTube视频1000万张图片。软件教本身认识猫。然而,新的软件先进得多。
”我吃惊的是,即使是少量的训练数据,我们能够做的很好,”说,Oriol Vinyals,的四个研究人员写道,与其他被亚历山大•Toshev萨米Bengio和Dumitru Erhan。“这个领域才刚刚开始,我们会看到很多增加。”