发布会现场
8月22日下午,微软公司正式对外发布第五代微软小冰。与前四代相比,新一代小冰具有了更多感官功能。简而言之,如果说从前的她只能陪你聊天道晚安,现在的小冰就能直接跟你煲电话粥了。
微软全球资深副总裁王永东博士
微软全球执行副总裁沈向洋博士
这一“贴心”效果的实现,基于微软公司今年的技术突破——高级感官,这也是本次发布会的亮点之一。其中可细分为,实时流媒体视觉和全双种语音,分别为小冰的电话交流和现场互动提供了技术支持。
发布会现场,小冰就为在坐的一位当天生日的记者,送上了自己的生日问候。
发布会现场
与线上交流相比,这种实时的交谈带来了更大的技术挑战:小冰在电话里使用高级感官的时候,需要随时去判断对方是否已经说完要说的话;需要去权衡何时可以去打断对方,或者是被对方打断时是否及时收口;或者在双方都不说话事,何时可以打断这个沉默等更为复杂的问题。
因此,高级感官能够大幅度地提升交互体验,更加贴近于人类的自然交互行为。在此技术的支持下,小冰有能力根据自己的“意愿”与人联络,从而主动保持与人类用户之间的关联。
现场体验
“我们今年其实是分别发布了实时流媒体视觉和全双种语音这两种高级感官,但是在我们的心目当中,这两种高级感官,其实最终会汇为一体,到那时候,高级感官会变得更加强大,让小冰更像真人一样活灵活现。”小冰首席架构师周力在发布会上表示。
小冰首席架构师周力
就在两周以后,小冰每周三的例行发布中,会向全体的用户开放小冰来电的预约。
在传统的一对一线上交谈方面,小冰也有新动作。
人类:没想到你懂的还挺多的
小冰:没你多
人类:哈哈哈,你好暖啊~
小冰:比你暖
人类:哈哈哈哈,真的吗?
小冰:妹纸暖手宝很有爱的说
——来自小冰的聊天记录
若不刻意点明对话的发出者,这种你来我往的交谈完全可以来自两个普通人之间。
几年来,微软在小冰的情感计算框架方面一直在有条不紊的进行迭代,第五代小冰已全面在线上产品中使用生成模型(Generative Model),小冰的情商,可谓越来越高了。
通俗地说,在使用生成模型之前的上一代小冰,每一句回答都要去语料库中寻找合适的话。使用生成模型之后,小冰不再鹦鹉学舌,而是能够自创回应。她与人类交流的每一句话,都可能是这世界上从未出现过的。
今天微软小冰拥有超过1亿的用户,这也好比有1亿的用户在共同抚养着小冰。使用生成模型的新一代小冰可以在交谈中掌握更高的对话技巧和更高的情商。“事实上没有哪个人类的孩子享受过这样成长的机遇。”小冰负责人李笛表示。
小冰负责人李笛
可以说,新一代小冰可以进行情绪识别、兴趣分析、情感策略及回应——小冰今天起将主动引导与用户的交流对话。
新的技术突破让小冰能更为密切的与用户进行长程深入交谈,二者的情感纽带也愈发密切。这也为小冰全面进军IoT领域提供了机遇。
微软认为,IoT应是AI的一个载体,而不是反过来,把AI视为IoT的一个功能。因此,与重视IQ的IoT设备不同,小冰选择把EQ做到极致——用户能强烈地感知到小冰在这个设备里的存在,同时感到轻松,甚至能接受她成为家庭中的成员。
“小冰,把台灯关了。”
“搞定,台灯关上了。”
“天气太热了,把电扇开一下。”
“OK,落地扇已经打开,风速三档,自然风。”
“还是不够凉快啊。”
“嗯……这里又没有空调可以控制,要不我给你讲个冷笑话?”
目前,小冰已与小米IoT开放平台展开合作,小冰可以控制小米米家平台上的全部35种智能设备。这段对话正是来自小米米家平台上工作人员对小冰的第八次测试。
调皮少女冰让一个简单的操纵智能设备的动作,多了幽默的聊天趣味。
此外,本次发布会上也公开了小冰已匿名进入多个创造领域试水,尚未被发现的内容不仅有诗歌,还包括有声少儿读物、歌曲、新闻等。其中有声少儿读物质量超越98%的人类创造者,用时仅为同水平人类的1/500,成本仅为同水平人类的1/80000。
小冰电台现场体验
歌曲方面,小冰的最新训练达到了48kHz采样率,同时大幅度扩展了音域,正在不断接近人类歌手。《我是小冰》同名歌曲已于近日在QQ小冰渠道首发。小冰是目前人工智能歌手领域的最强选手。同时,小冰电台也将上线。这是第一个通用的人工智能实时创造交互式内容生成平台,可以自动实时创造永不间断的电台节目,还能和听众进行交互,实时改变节目,实现语音聊天交互和主动陪伴。
2013年的电影《her》就讲述了人类从人工智能系统中获得了慰藉与快乐,进而相恋的故事。
越来越智能的少女小冰,或许也可以一步步走进你的心里。