周健报道 从未学习过绘画的人,要在几秒钟内阅读成千上万张图片,搞清楚这些图片的画风和画派,然后按照指令,将另外的成千上万张图片分类,这显然是做不到的。而且,电脑也没有强大到这种程度。但是,上海西井信息科技有限公司把这件不可能的事情成真了,9月17日发布的“片上学习”(On-Chip Learning)芯片,在全球首家实现了硬件端直接完成“自我学习”和“自我提高”,这种芯片今后应用于移动智能终端、家用智能终端或是大数据专用服务器等多领域,将使得科幻电影里的场景成为现实。

成功率已达100%

上海西井信息科技有限公司(简称,西井科技)的CEO谭黎敏9月17日宣布,在全球范围内首次实现“片上学习”(On-Chip Learning)。“在机器学习领域,‘片上学习’较目前流行的‘在线学习’(On-Line Learning)又往前跨了突破性的一大步,这意味着机器学习能在硬件端直接完成,通过硬件层面的不断‘自我学习’和‘自我提高’,实现高效率、低功耗。未来,无论是在移动智能终端、家用智能终端或是大数据专用服务器等多领域,‘片上学习’都将展现其独有且强大的优势。”

9月17日,西井科技的专业人员,在一个名为WIKI的系统中,演示了“片上学习”过程。他们随意点击几种画风、画派,供硬件端“片上学习”后,要求芯片从1万幅油画中正确而快速地找到选中的画风、画派。期间,安排芯片随时中断学习,以测试学习效果。结果发现,随着芯片学习进度的推进,油画识别与分类的正确率逐步上升,直至经过8至10秒的一段完整学习后,识别的正确率接近100%。

抽象画、巴洛克、花卉、室内、肖像、极简主义、波普艺术、超现实主义,这些画派和画风,对于浸润艺术多年的专业人士,想要做到看一眼便能直接分出画作流派,并不是件容易的事,更何况从未学习过绘画的菜鸟。即便是电脑,全球范围长期以来也没有强大到这种程度。

自2014年起,加州理工大学Sergey Karayev等人收集了Wiki-paintings画作以来,全球不少团队已加入机器快速识别、分类的研究中,以此来检验机器学习的成果。

从全球范围内来看,目前机器学习常用“在线学习”(online learning),即按照顺序、循序的学习,不断的去修正模型,进行优化。已有多家公司尝到“在线学习”的甜头,在视觉、声音、大数据等领域人工智能均有突破。与此同时,研究人员也未停止对“片上学习”研究,因为只要实现这一技术,就能直接在硬件上完成学习与测试,进而让基础算法的研发迭代,产品的升级有着更短的周期和更高的效率,并且消耗更少的能源。

事实上,从1990年代起,大量的研究便集中在如何将算法嵌入硬件的理论研究中,但那时针对的仅是诸如非常简单的波形、信号处理。

到了2010年后,由于维持摩尔定律硬件的研发成本不断提高,刺激了学术界域工业界对于专用芯片的研究,开始有了配置硬件的高级语言接口。

据悉,“片上学习”在严苛的硬件环境中依旧研究进展缓慢,并没有一个成型的应用于实际问题的演示,一直停留在理论研究阶段。

现阶段,在硬件中部署机器算法更多还是“在线学习”,即用大规模高性能计算平台进行模型训练,然后将训练好的模型再直接部署在硬件中。

“片上学习”胜过“在线学习”

率先实现突破的西井科技,是由它的神经形态实验室(WNR),首次在全球范围内实现了“片上学习”,并将此技术直接在Wiki-paintings画作集上进行了可重复的成功测试。

据介绍,西井科技此次实现的“片上学习”,打个比方来说,就好像学生身边时刻跟随着一位“私教”,直接在芯片上边学习边测试训练成果,最大的优势是真正实现“无网络”情况下的“自我学习、自我实时提高”。

而“在线学习”则好比学生定期去“学校”上课,回家后做作业来测试学习效果,再将优化过的模型灌输在硬件中,每一次新的学习都需通过网络、云端等手段重新进行传输、迁移。

因为“片上学习”可以实现本地化学习,从而帮助机器大幅度提升效率,提高运算速度。在网络环境相对严苛或有限的情况下,“片上学习”的芯片消耗的带宽和流量更少,大幅降低云端服务器的通讯成本,且耗时更少。毕竟“在线学习”需要更高质量的网络环境,在数据传输时会造成延迟。

谷歌的AlphaGo就是“在线学习”的典型,在今年与李世石比赛时,AlphaGo的服务器在美国中西部,通过谷歌云服务连接到韩国首尔的对局室,谷歌总部团队必须确保AlphaGo与谷歌的服务器连接顺利。

另外,“在线学习”算法存储在后台服务器或云端,在算法更新或使用时会产生高功耗,若实现算法本地化后可大大节约功耗。

有资料显示,2015年中国数据中心的电耗为1000亿度,年耗电量超过全社会用电量的1.5%。一些大企业的数据中心能源费用甚至能达到数十亿元。如果“片上学习”被运用在数据中心,可本地化处理数据,服务器运行带来的功耗成本也随之而大大下降,将大幅度降低企业的电费支出,更重要的是提升大数据挖掘、视频流处理的质量与效率。

尤其值得一提的是,“片上学习”将使得终端手持设备更智能,手机、眼镜和无人机等的智能水平都能达到一个新的境界,实现“无网络”状态下的深度学习,同时也使超级计算机小型化成为可能。

以基因测序为例,因涉及大量的运算,目前来说依靠超级计算机处理。今后依靠“片上学习”就能大幅节省排序时间,医院就可以作为小型化的计算终端,提前在医院进行基因排序。

又比如,很多人看过的波士顿动力的人形机器人的行走视频,机器人行走的稳定性令人震撼,很大程度上得益于其强大的算法,为了满足这一算法的能耗,机器人在学习时背着笨重的电池,身上还得插满数据线与大型处理器相连。而“片上学习”直接在硬件端完成学习,则能帮助机器人外形更为灵巧,依靠“自身智力”去不断学习提高能力。

在家用智能终端方面,依靠“片上学习”,那些智能路由、智能办公室服务器都能实现算法的本地化,更加保障了数据的安全和私密性。

有了“片上学习”,未来无论是大数据的深度挖掘,还是智慧城市视频流监控分析等人工智能所涉及的各领域,都将变得便捷和智能化,而这无疑将加速人工智能的应用进程,科幻电影里的场景将一个个成为现实。