微软开放Project Oxford新API 包括Cortana语音识别
来源:科技讯    浏览次数:    发表时间:2015-12-15    【    

科技讯】12月15日消息,微软今天公开上个月刚刚宣布的Project Oxford 新 API,这是一项CRIS技术的私人预览,该项功能可以通过识别用户的声音获得文字输入功能。


微软开放Project Oxford新API 包括Cortana语音识别

  同样在今天,微软为CRIS语音输入技术开放了两个API端口,开发者将可以通过该项技术了解到谁在进行语音录入并且讲义视频的形式呈现出来,包括说话者识别和视频 API,以及自定义识别智能服务,都是微软 Project Oxford 人工智能功能的一部分。

微软开放Project Oxford新API 包括Cortana语音识别

  其中:

  •   说话者识别 API 提供了语音验证、说话者识别功能,前者可以用于身份验证,后者可以在一群说话者中识别说话个体

  •   视频 API 通过微软视频处理算法,能够脸部追踪、动作检测、视频稳定,主要来自Microsoft Hyperlapse 技术

  •   自定义识别智能服务,适合在吵杂的环境,或者不标准语音的识别(比如非母语带严重口音的)

  以上所有的技术均来自微软的Project Oxford项目,该项目为微软在数年前建立用于为第三方开发者提供人工智能研究的项目途径。

  此外,微软还表示语音识别输入系统的测试版将在年底向公众开放。


网友评论

文明上网理性发言(登录后才能发言)

  • 发表
  • 验证码: 
用户名: 密码: 登陆  新用户注册
  • 精华推荐
  • 今日话题
版权所有  ©  温州梦幻信息技术有限公司 网站备案号:浙ICP备15029386号-1