量产不到一年AI语音芯片出货就达百万级!探境轰动市场的秘密

量产不到一年AI语音芯片出货就达百万级!探境轰动市场的秘密

今年3月份,雷锋网《舍弃冯诺依曼架构突破内存墙瓶颈的AI芯片,即将轰动市场?》一文介绍了解决AI芯片内存墙挑战的多种路径以及探境科技采用的创新方法。距离文章发布不到十个月之后,也是探境首款AI语音芯片量产不到一年之后,探境科技CEO鲁勇本周宣布探境的语音识别方案实现百万级出货。

当时,鲁勇对于SFA架构进一步的解释是,存储是我们SFA架构优先的出发点,去考虑数据在搬移过程中做计算,也就是由数据带动计算而非由算子带动数据。与通常计算的先有计算指令然后提供数据相反,SFA架构是先有数据,然后再把算子交给它。

——加大融资支持,还款困难可展期

在布鲁塞尔国际机场,留比学联会送来了500多件(套)防护服、防护镜,表达了海外莘莘学子心系祖国的深深情怀。海航布鲁塞尔办事处为这批物资免费开通了绿色通道,以确保物资及时运往武汉。

宁波提出,地方银行法人机构信贷支持政策,按照总规模100亿元额度为受疫情影响较大的企业贷款减免3个月利息;对中小企业和“三农”主体减免或减半收取担保费。

除了高能效比,SFA架构还带来了通用和易用的优势。鲁勇说:“我们的芯片是首款通用型AI芯片,可以支持所有已知的神经网络,对数据类型也没有限制,对常见的稀疏数据也可以实现自适应支持。”

因此,基于SFA架构的探境AI芯片采用28nm的工艺能效就超过4TOPS/W,数据访问降低10倍到100倍,存储子系统功耗降低10倍以上。

鲁勇所说的精度几乎没有变化,指的是量化后精度有千分之几的变化。比如从浮点16位时的95.7%的精度量化为定点八位后精度变为95.3%。

 探境科技CEO鲁勇

事实上,餐饮业只是疫情影响下的一个典型代表。

至此,探境AI芯片能够快速落地的秘密也就清晰了。最底层,探境进行芯片架构进行的创新,打破AI芯片内存墙的限制。当然,SFA架构除了带来更高能效比、更低功耗,通用性让其不仅可以用于AI语音,也适用于AI视觉处理。根据鲁勇的说法,SFA架构也能用于云端的训练和推理。

2月1日,央行等五部门下发《关于进一步强化金融支持防控新型冠状病毒感染肺炎疫情的通知》,明确——

“市场环境影响,如销售持续不见好转,三个月之内可能会出现资金链紧张的情况,面临无法支付供应商货款、物业房租、人员工资等实际经营困难。”中国烹饪协会说,餐饮行业的中小企业占绝对主体,抗风险能力较差,这些特征注定在抗击疫情的特殊时期,餐饮企业普遍停业会带来巨大困难,举步维艰。

从语音识别的过程来看,想要获得满意的结果,首先需要的是降噪算法。探境科技联合创始人 软件研发副总裁李同治介绍:“我们的降噪算法基于深度学习,不仅可以处理常见的稳态噪声,对一些非稳态的噪声和突发性的噪声也可以很好地处理。为了验证这套算法识别的有效性,我们将一批信噪比在3dB左右的语音数据送到一家知名互联网公司的云端识别引擎进行测试,结果显示降噪后比降噪前的识别率能够提升30%以上。”

那么,下一个问题是,首款AI芯片量产不到一年出货就达到百万级,已经有30个合作伙伴的探境科技,在AI视觉市场是否也快速落地?雷锋网(公众号:雷锋网)

在实际的场景测试中,HONN使用单麦克风效果也十分显著。但语音识别的场景还有更加苛刻的场景,比如扫地机器运行中产生的声音,或者控制客厅或厨房中家电设备时距离较远语音信号快速衰减,这时候就需要使用麦克风阵列。

——不得盲目抽贷、断贷、压贷

对比传统的DNN算法,HONN特点在于算法的参数大概是传统DNN算法的1/5,更少的参数意味着只需要更少存储面积,也就相当于更低的芯片成本。虽然参数更少,但HONN单帧对算力的需求超过几百兆OPs,DNN仅为个位数。

中小企业是吸纳就业的主力军,对于经济稳定增长至关重要。面对中小企业因疫情承压,从国家部委到地方政府,一系列具有含金量的支持中小企业的政策出台,为他们雪中送炭,助中小企业渡过难关。

采用这样的方法就意味着可以用更少的麦克风实现更好的效果,谷歌表示,使用端到端的处理算法后其双麦的识别率可以达到了传统算法7麦克风阵列的识别率。

鲁勇还透露,SFA架构的图像芯片已经成功流片,图像AI芯片的核心指标IPS/W全球第一,达到了800 IPS/W。

不过,客户并不关注芯片的架构创新,他们更关注成本及易用性。探境独特的量化技术可以节省迁移成本,软件平台可以降低开发者的使用门槛,这让芯片成为了易于使用的方案。

雷锋网原创文章,。详情见转载须知。

此外,上海宣布可延长社会保险缴费期,相关补缴手续可在疫情解除后3个月内完成。推迟3个月调整社保缴费基数,据测算,预计当年度将为企业减轻社保缴费负担101亿元。

上海、山东、江西、宁波、苏州等地宣布,对不裁员或少裁员的参保企业,可返还其上年度实际缴纳失业保险费的50%。

舍弃冯诺依曼架构突破内存墙瓶颈的AI芯片,即将轰动市场?

国家发改委副主任连维良3日说,从目前情况看,疫情对当前经济特别是对消费的影响在加大,尤其是对交通运输、文化旅游、酒店餐饮和影视娱乐等服务消费影响都是比较大的。

财政部2月1日下发《关于支持金融强化服务 做好新型冠状病毒感染肺炎疫情防控工作的通知》,对受疫情影响暂时失去收入来源的个人和小微企业,地方各级财政部门要会同有关方面在其申请创业担保贷款时优先给予支持。

中国人民银行资料图。中新社发 李慧思 摄

但要最终打动用户,解决用户痛点才是决定因素。这方面,探境所做的是在降噪、识别算法中也采用深度学习,基于SFA架构带来的高算力,用模型参数更少但对算力要求更高的AI模型,实现用两个麦克风阵列达到4个甚至7个麦克风阵列的效果。

——延长2月纳税申报期限

江西提出,对承租国有资产类生产经营用房的企业,1个月房租免收、2个月租金减半。对租用其他经营用房的,鼓励业主为租户减免租金,具体由双方协商解决。

交通运输部有关负责人表示,部分汽车客运站在销售汽车客票时,违背乘客意愿搭售人身意外伤害保险的行为,违反了《中华人民共和国保险法》保险合同自愿订立,不得利用职务或者职业便利强迫、引诱投保人订立保险合同等相关规定,侵害了乘客的合法权益,影响了人民群众出行的获得感、幸福感。

李同治表示,之所以探境能用更复杂的算法实现更好的效果,除了我们有强大的算法研究实力,同样重要的是有高算力的SFA架构芯片完美地制程这套算法和框架。

当然,除了技术,市场策略也非常关键。探境的SFA架构可以用于AI视觉,并且探境成立之时是AI视觉更火热的时候,但鲁勇并没有选择安防市场,而是首先进入更容易落地和产生营收的AI语音市场,用更高的算力融合更更好的算法,让产品具有更强的竞争力。

据了解,北京市仅住宿、餐饮两个行业就有1.7万家企业、24万职工参保,缴费就达3.2亿元,那么仅对这两个行业就缓冲了3.2亿元。西贝莜面村在北京的门店有2000多人参保,每月负担的社保费有247万元,新政策的出台将对他们提供很大支持。

——允许企业延迟缴纳社保

百万级出货,只是衡量一款使用成熟制程工艺成功的最小出货量级,但对于AI芯片来说却意义重大。此前我们已经多次强调,对于AI芯片初创公司而言,设计出芯片只是成功的开始,能否大规模落地才更为关键。

苏州明确,因疫情原因,导致企业发生重大损失,正常生产经营活动受到重大影响,缴纳房产税、城镇土地使用税确有困难的,可申请房产税、城镇土地使用税困难减免。

还有非常重要的一点,将AI模型从云端迁移到终端,使用探境的芯片不需要重新训练。鲁勇表示:“我们提供的工具链可以给零基础的客户使用,不仅在算法从云端到终端迁移的时候不需要重新训练,节省时间。还能保证模型从浮点到定点进行量化之后,精度几乎没有变化。”

通过软硬一体的优化,用成本、易用性、效果提升、系统易集成带来的优势,最终打动用户。

助力企业度过疫情寒冬!

上述通知要求,要求对受疫情影响较大的批发零售、住宿餐饮、物流运输、文化旅游等行业,以及有发展前景但受疫情影响暂遇困难的企业,特别是小微企业,不得盲目抽贷、断贷、压贷。

“我们的唤醒识别全部依赖增强后的信号,不会出现信号增强依赖于单麦唤醒的情况。并且在训练的过程中,还加入了注意力模型和注意力机制,这样干扰源和信号源接近的时候也能处理得很好。”

为进一步拓展市场,探境近日也和国内知名电子行业分销商世强先进科技有限公司以及致力于智能语音控制与交互技术研究、创意产品设计和生产销售的深圳阿凡达智控有限公司也达成了合作。

据了解,疫情导致春节期间餐饮业损失严重,年夜饭的退订量达到94%至100%。

传统的麦克风阵列有三个缺点,一个是声源定位依赖单麦克风,远场时唤醒率低影响使用体验;另一个是降噪算法和识别模型不适配;还有就是对多个麦克风以及电容等元器件一致性要求非常高,无形提高了整个系统的物料成本;最后,当干扰声源与目标声源方向接近时,这套流程也无能为力。

2月1日,鲜有人员走动的黄兴路步行街,炸臭豆腐的铜像雕塑也戴上了口罩。鲁毅 摄

对受疫情影响严重的企业到期还款困难的,可予以展期或续贷。通过适当下调贷款利率、增加信用贷款和中长期贷款等方式,支持相关企业战胜疫情灾害影响。

如今,无论是巨头还是初创公司,大都为AI芯片难落地的苦恼。显然,探境科技量产不到一年的音旋风(Voitist)611 AI语音芯片出货就达百万级值得关注,他们取得这一成绩的策略和方法或许也值得参考和借鉴。

SFA架构解决内存墙挑战的核心是,既然深度学习算法需要的卷积运算的乘法计算次数不能减少,那就想办法把数据在存储器和运算单元之间的搬运次数降低,达到提升算力、降低功耗和解决内存带宽限制的目的。

数据显示,目前市面上的AI图像芯片这一指标大都没有超过100 IPS/W。

基于升级的双麦克风算法,探境也对音旋风611进行了升级,推出了音旋风612语音识别方案,对麦克风及配套电路的要求更低,高噪声环境的识别率更高。

3月份的文章已经介绍了探境科技设计出的非冯诺依曼架构的计算架构——存储构SFA(Storage First Architecture)。SFA架构解决内存墙挑战的方法比较独特,以存储调度为核心的计算架构,数据在存储之间的搬移过程之中就完成了计算,计算对于数据来说只是一种演变。

国家出手了!为中小企业雪中送炭

30%是个什么概念?根据李同治播放的音频,使用探境的AI降噪算法,能够有效地过滤风声、雨滴声这些噪音。

最终结果显示,在信噪比大于10dB和5-10dB的环境中,HONN命令词识别准确率的提升分别为2%和10%。

企业疫情期间损失主要是应防控要求门店不能正常营业,造成在没有经营收入的前提下,还要承担储备食材过期损失,要支付员工工资、支付店面租金及相关费用、外卖送餐平台佣金(因商家与平台的合作协议是属于年度合同)等,同时还要为员工防疫额外支付防护设备设施的项目开销。

同时,针对语音市场还布局了低功耗、主流、旗舰产品,能够全面满足市场需求。为满足客户不同的需求,既可以单独提供芯片或者算法,也能够提供全栈的方案。未来还将推出针对图像市场的8XX系列芯片。

苏州明确,若中小企业承租国有资产类经营用房,免收1个月房租、减半2个月房租。

国家税务总局近日下发通知,在全国范围内将2月份纳税申报期限延长至2月24日;对湖北等疫情严重地区可视情况再适当延长;对受疫情影响办理申报仍有困难的纳税人可在此基础上依法申请进一步延期。

降噪后的下一步是识别,在语音识别中,探境采用的是其称为HONN的新型高计算强度神经网络。李同治透露,HONN将计算机视觉中的一些经验迁移到语音识别中。HONN增加了卷积的操作次数,减少了传统DNN/TDNN算法中全连接的次数。

人社部办公厅1月30日发布《关于切实做好新型冠状病毒感染的肺炎疫情防控期间社会保险经办工作的通知》,因受疫情影响,用人单位逾期办理职工参保登记、缴费等业务,经办机构应及时受理。

来自眉州东坡数据显示,春节期间的员工工资支付848万元,为员工发红包220万。房租方面,尽管目前生意下降了8-9成,还要支付每月店面和员工宿舍房租1400多万元。由于疫情突然,在口罩、消毒液、体温表、酒精、防护服等消毒设施用品的支出已经约38万元,此项费用还在持续中。

由于没有详尽的说明,SFA也有被误解为最近几年讨论很多的存内计算(In-Memory Computing),鲁勇近日再次接受雷锋网采访时首先明确,SFA不是存内计算。我们说SFA不是冯诺依曼架构,指的是SFA不是以计算带动存储。不过,SFA架构采用的是标准单元库设计,没有改变底层的工艺。

——申请创业担保贷款时优先给予支持

这是前比较前沿的方法,国外的亚马逊、谷歌也在采用端到端的方法做增强和识别的一体化处理。根据探境给出的数据,亚马逊采用的是基于可学习的空间滤波方法,在信噪比低于5dB时,单字识别错误率相对降低15%。谷歌使用的方法是频域因子分解模型,单字识别错误率相对降低16%。探境的频域复数子空间投影命令词识别错误率相对降低20%。

其中,北京市近日出台19项措施,包括允许延迟缴纳社会保险费,将1月、2月应缴社会保险费征收期延长至3月底。对于旅游、住宿、餐饮等10个受影响较大的行业企业,可将疫情影响期间应缴社会保险费征收期延长至7月底。允许企业综合调剂使用年度内的休息日等。

多地宣布对中小企业减免房租费用。其中,宁波对承租国有资产类经营用房的中小企业,免收2个月房租。

“为了解决这些问题,我们提出了基于FCSP(频域复数子空间投影)的端到端AI双麦新算法,把增强和识别一体化,进行端到端的识别流程。在这个识别流程中,我们放弃了使用传统的数字信号处理算法来做语音增强,而是用一套基础于深度学习的AI算法做信号增强。处理算法的参数和神经网络一起训练,通过整体优化降低最后的识别错误率。“李同治还进一步指出。

如何稳定经济增长,帮助企业渡过难关?好在,国家现在已经出手了!

山东也提出,因疫情影响遭受重大损失,经税务机关核准,可减征或者免征城镇土地使用税、房产税。

一系列真金白银的措施,

“SFA架构实现的方法是通过硬件、架构调度、数据调度管理等创新。实验数据表明,SFA架构所采用的各种微观和宏观调度算法,比较’类CPU架构‘采用的基于总线和指令集的映射方法,在近似存储量、近似算力、近似外部存储带宽、近似功耗约束的前提下,可以获得8~12倍的利用率收益。”鲁勇表示。

“经初步调研,贾国龙的话并非危言耸听。”中国烹饪协会表示,此次疫情对餐饮业造成的损失较大,被媒体公认是“最受影响的行业之一”。

餐饮、旅游等企业因疫情遭遇寒冬

当然,优秀的架构必须很好地融合算法,才能最大化硬件的优势。特别是AI时代,越来越多人意识到软硬一体的重要性。探境在算法上也有其独特的降噪和识别算法。语音识别大致可以分为四个过程,语音信号采集、语音信号处理、语音识别、获得结果。以家居这个AI语音落地较多的场景为例,具有信噪比(信号与噪声的比例)比较低,会有不可预见的噪声以及多个声源等挑战。

他透露,“我们有一套从特别的量化技术,硬件上提供一些比较冗余的信息,保证即使量化为8比特也不会丢失信息。同时借助AI、非线性的一套算法,通过软硬结合的方式,甚至可以做到量化到4比特,模型都不需要重新训练。”