@一切客户,属于你的官宣在这里!!!亲爱的支持与信任言通产物的小同伴们,言通机器人语义辨认引擎行将重磅来袭,请做好预备! 人工智能的智慧在此闪烁 目前,市面上一切的人工智能电话机器人都接纳的是要害词婚配技术,但是中国言语胸无点墨,异样的意思有差别的表达方法,而要害词婚配技术辨认单一化。为此,言通正在改进这种状况,将于近期强势推出基于真正的自然言语了解辨认客户的对话内容,让机器人到达完满的语义了解。 智能云端销售客服语音办事提供商 深度解读语义辨认引擎 情感阐发 目的:为了找出说话者在某些话题上的态度,即信息预测。这个态度或许是他(她)的小我私家判别或是评价,也许是他(她)其时的情感形态。 完成的技术手腕:基于监视学习的情感阐发,运用的监视学习算法是TFIDF计算TfidTran沈阳网站设计sformer、文本向量化CountVectorizer。经过引入情感词的水平副词等一系列字典来给输出的语句停止打分,从而判别该语句的情感倾向。 意图辨认 目的:精确定位询价,理解公司状况,理解产物状况,索要联络方法,嫌贵等意图,在大数量的通话中无效的挑选出意向客户。 全体流程 1.获取训练语料 2.语料预处置惩罚 3.生成词向量 4.运用LSTM停止训练 5.外接softmax多分类 深度学习神经网络的方法效果很好,但数据集数量必然要大,且每个类别的数据漫衍要平衡。为了制止我们的数据集语料每个类别的数据达不到尺度,言通机器人语义辨认引擎换成了用机器学习的要领来做意图分类:别离接纳LDA文档主题模型(经过计算句子类似度,来停止文本的分类),并用特征向量模型来提升AUC的精确率。 改进的多项朴素贝叶斯 由二分类的朴素贝叶斯百度排名拓展到多项完成的模型,运用词袋模型,公用的停用词表,近义词林,改进的数学模型等多种手腕完成的分类器。以每个话术现有的语料训练,对类似的短句差别的分类,辨认敏感。对近义但却未呈现在话术中的词句有良好的分类才能。 分类器的敏感度提升 接纳骰子概率加样本概率取代了拉普拉斯平滑,对敏感度有正面的影响,用对数处理最小溢出的同时,修正两个概率的底数,降低了概率最大值却不影响最终辨认精确率的同时使其能区分极端类似的单个短句。 词袋模型 词袋模型良好的躲避了汉语中文本前后倒置的成绩,是词集模型的晋级版,可以提升重复呈现的要害字的权重,提升辨认精确率。 用上述要领革新的分类器曾经可以对未知样本有很好的支持。好比话术中只包罗有“公司什么时分建立”这一句语料。而对付“公司几几年建立的”,“公司建立工夫”,或许是“几几年建立的啊你们公司”这样的比力白话化的词句可以精确分类。在此根底上再引入近义词词林,完成对近义但未呈现在话术中的词句的分类。 举例近义词林 经过完善一本近义词辞书,来到达触类旁通的效果。 好比对“公司地点”一句语料停止转换 公司→【商店 铺子 店肆 铺户 店家 商行商号 店肆 号庄 局 肆 桂 公司 洋行 代销店 店堂 供销社 小卖部 信誉社 商社 商厦 铺面 营业所 互助社 商家 企业】 所在→【所在 地点 中央】 由上述两个数组求出笛卡尔积把本来一句语料扩大为29*3再经过改进的模型训练,无效进步分类精确率。 有人说,企业办事的下半场,将是人工智能的对决!为此,言通智能的脚步从未停歇,只为给你提供更好的产物办事! 言通机器人项目加盟互助:http://www.admin5.com/xm/yantong/?wz (责任编辑:admin) |