kb体育(中国)官方网站-登录入口






咨询热线(xiàn):021-80392549

kb体育(中国)官方网站-登录入口 QQ在线 kb体育(中国)官方网站-登录入口 企业微信
kb体育(中国)官方网站-登录入口
kb体育(中国)官方网站-登录入口 资讯 > 人工智能 > 正文(wén)

声音定制三天交(jiāo)付,深声(shēng)科技如何(hé)在语音AI赛道弯道超车?

2020/01/13446

自2015年开始,中国人工智能市场(chǎng)规(guī)模逐年攀升(shēng),2018年中国人工智(zhì)能市场规模约为238.2亿元,增长率达到(dào)56.6%,据(jù)预测,到2020年,中国在人工智能的市(shì)场规模将接(jiē)近500亿元。

“语音(yīn)是AI智能时代的重要入口(kǒu),”深声科技创始人周(zhōu)俊明(míng)说(shuō)。他的底气来自多(duō)年的行业积(jī)累和互联网产品(pǐn)开发经验。

2012年,周俊明从中科院计算所博(bó)士毕(bì)业,顺(shùn)利进(jìn)入(rù)广电行(háng)业(yè)龙头企业北京永新视博担任高级算法工程师,主要负责音视频(pín)算法工作(zuò);2013年,他(tā)凭借音视频算法(fǎ)技(jì)术能力,被腾讯(xùn)选(xuǎn)中(zhōng),故(gù)任(rèn)职于此,继续从事在线(xiàn)音视频算法技术研发工作;2016年,他加入(rù)了欢聚(jù)时代,担任音视频技术总负责人,带领国内顶级音视(shì)频团队,为YY提(tí)供核心技术服务和技术创新方案。

2018年,周俊明和核心团(tuán)队成员共同创办(bàn)了“深声(shēng)科(kē)技(jì)”,一家智能语音技术服务商,主(zhǔ)要通过基于(yú)深度学习(xí)的文字转(zhuǎn)语音(yīn)整体解决方(fāng)案服务B端客户(hù),提高客(kè)户(hù)在行业(yè)内的竞争壁(bì)垒,帮助客户形成独有的竞争(zhēng)优势。据(jù)悉,成立不到半年,深声(shēng)科技就获得了来自(zì)小米科(kē)技的数千万元天(tiān)使轮融资。

AI行业从不(bú)缺竞争对手,BAT等头部(bù)大企业有强(qiáng)者的打(dǎ)法(fǎ),初创企业也有自己(jǐ)弯道超车的策略。深声科技在多年的实践摸索(suǒ)发现,以(yǐ)往客(kè)户(hù)在语音合成(chéng)中(zhōng)最关心的是信息的传递。但(dàn)随着物质生活的不断(duàn)提高,客户对于语音转化真实感的(de)需求也(yě)日益(yì)剧(jù)增,催生了拟人声智能营销、拟人互动、拟(nǐ)人陪伴等(děng)大规模(mó)商业化应用场(chǎng)景和价(jià)值。基于此逻辑,深声(shēng)科技在商业模式(shì)方面主打三大场景:语音内容(róng)输出、智能语音交互、智能客服营销(xiāo)

其(qí)中,内(nèi)容输出业务是深声科技重点推进的主线(xiàn)业务,团(tuán)队主要通过(guò)与有版权IP的企(qǐ)业合作,以有声阅读的方式将深声语音呈现给(gěi)消费者(zhě),内容涵盖(gài)文学、动漫、新闻资讯等多(duō)种题材和类型。根据深声科(kē)技提供的(de)数据(jù)显(xiǎn)示(shì),深声目前已与十余(yú)家行(háng)业头部的内容(róng)版权(quán)企业达成合(hé)作,一(yī)方面为企(qǐ)业提(tí)供文字(zì)语言转化工具,按字(zì)数收费;另(lìng)一方面,提供语音合成整体解(jiě)决(jué)方案,共同开发版权(quán)IP的语(yǔ)音形式。

语音(yīn)交互业务(wù)中,团队依托投资方小米(mǐ)的资源(yuán)及产品,重点服务智能语音音(yīn)箱和车联网企业,为其提供语音(yīn)合成、数据制作和人机(jī)交互等服务,协助(zhù)客户在产品开(kāi)发过(guò)程中精准感知用户需求,增强行(háng)业竞争优势。

智能客服营销业务是(shì)深声科技(jì)正在尝试的场景,深声科技主要帮助运(yùn)营商和(hé)金融客户定制声音并合成声音,使其在营销过程中(zhōng)提高通话时长和营(yíng)销(xiāo)转化率。谈及看好语音(yīn)交互和智(zhì)能客(kè)服营销这两类客(kè)户群体的原(yuán)因时,周俊明告诉创业(yè)邦(bāng),这两类客户对于语(yǔ)音音质的要求更高,通过深声科技(jì)自身语音合成技术的优势能很快产生规模(mó)化效应,且这(zhè)两类客户群体的长(zhǎng)期付费能力更强。

从时间的维(wéi)度上看,深声科技相比科大讯(xùn)飞、商汤科技等AI企业(yè)入(rù)局较晚,但(dàn)团队正在加紧业(yè)务(wù)布局,构建自(zì)身技术(shù)壁垒。首先,基于端到(dào)端的语音合成技术逻辑,深声(shēng)科技会对采(cǎi)集到的原始语音进行自动标注,再(zài)由声学模型算法对语言和(hé)语(yǔ)音(yīn)进行音素级(jí)特征(zhēng)对齐,可以实现(xiàn)完全拟(nǐ)人发声,将语(yǔ)气、语调、语速、抑扬顿挫等语(yǔ)音特点(diǎn)完(wán)美呈现。在(zài)Blizzard Challenge 2019 国际语音(yīn)合成大赛中,该(gāi)技术在PER(拼音-不包(bāo)含声调-错误率)和PTER(拼音-包含声(shēng)调-错误率)两个指标(biāo)上(shàng)优于科(kē)大讯飞(fēi)。此外,团队在声音定制合成方面的交付能力突出,三天内便可(kě)完(wán)成(chéng),而行业一(yī)般需(xū)要3~6个月。

成立(lì)不到两年,团(tuán)队已有50多(duō)人规模,其中80%为技(jì)术研发人员。团队主要成(chéng)员拥有中科院、中(zhōng)山大(dà)学、华(huá)南(nán)理工、日本早稻田大学等名校硕博教育(yù)背(bèi)景和腾讯、网(wǎng)易、YY等名企工作经(jīng)历。联合创始人(rén)黄(huáng)博贤拥有12年的互联网语(yǔ)音和音频技术(shù)积累(lèi),先后在酷狗和(hé)YY主导语音和(hé)音频技术的(de)开发。

接下(xià)来,团队会重点在效果、性能、数据三个维度优化算法技术,为各行各业(yè)提供更多(duō)标准化解决(jué)方案,加速(sù)技(jì)术落地,同时完善智能(néng)语音交互全链(liàn)路技术(shù)。2020年,团队(duì)还将推出面向C端用户的语音克隆(lóng)产品(pǐn),在陪伴、亲子互动、泛娱乐等交互(hù)场景全面发力。

目前,该项(xiàng)目已启动(dòng)A轮融资,资(zī)金将全部用(yòng)于团队建(jiàn)设及业务拓展。

本文相关(guān)的文章列表页头图图片来源于(yú)摄(shè)图网,经授权使用。本文为创业邦原创(chuàng),未经授(shòu)权不得(dé)转载,否则创业邦(bāng)将保留向其追究法律(lǜ)责任的权利(lì)。如需转载或有任何疑问,请(qǐng)联系。

关键(jiàn)词:




AI人工智能网声明:

凡资讯来源注明为其他(tā)媒体来源(yuán)的信息,均为转载自(zì)其他媒体(tǐ),并不代表本网站(zhàn)赞同其(qí)观点,也不代表本网站对(duì)其真实性负责。您若对该文章(zhāng)内容(róng)有任何疑(yí)问或质疑,请立即(jí)与网站(zhàn)(www.jiangx.bijie.shanxi.linyi.jiaxing.zz.pingliang.ww38.viennacitytours.com)联(lián)系,本网站将迅速给(gěi)您回应并做处(chù)理。


联系电话:021-31666777   新闻、技术文章(zhāng)投稿QQ:3267146135   投稿邮(yóu)箱:syy@gongboshi.com

精选资讯更多

相关资讯更(gèng)多

热门搜索

工博(bó)士人工智能网(wǎng)
kb体育(中国)官方网站-登录入口
扫描二维(wéi)码关注微信
扫码反馈

扫一扫,反馈当前(qián)页面

咨询反馈
扫码关注

微(wēi)信公(gōng)众(zhòng)号

返回顶(dǐng)部

kb体育(中国)官方网站-登录入口

kb体育(中国)官方网站-登录入口