泰岳语义工厂_词法分析_分词|中文分词、命名实体|实体识别、地址识别、时间抽取、机构识别、姓名识别、词性标注

基于文本预处理技术,将文本分割成具有语义的独立词序列,标注词性,识别时间、地点、机构、人名等实体信息。用于文本分类、聚类、自动摘要、信息抽取、信息检索、机器翻译、问答系统、热点挖掘等应用场景。
了解咨询

雷达评级

A

用户规模

-

产品上线

-

产品亮点

1、模型泛化能力强:使用BEMSO序列标注方法,在分词预测过程中引入上下文信息,有效提升未登录词的识别能力。采用Bi-LSTM+CRF的网络模型框架,强化语言模型泛化能力。 2、适用性广:使用大量高质量标注的语料作为内置模型的训练语料,模型训练反复迭代优化,拥有更广泛的场景应用标准。 3、高精准实体识别:积累金融领域的高质量序列标注集,利用主流深度学习技术,在实体识别模型基础上,引入强化学习方法,强化公告重要实体识别能力。

产品说明

泰岳语义工厂向用户提供中文分词、中文命名实体识别、词性标注三大服务。该服务能够将中文文本内容分割成具有独立语义的字符序列,支持判定文本中词语的语法属性,确定其词性并加以标注,同时支持自动识别、提取文本内容中的人名、地名、组织机构、企业名称等实体信息。

 

产品参数

交付方式API服务

售后支持范围

泰岳语义工厂温馨提示 1、售后服务支持时间9:00~18:00,同时提供旺旺在线解答 2、为优化服务品质,部分服务提供限定次数内的免费服务 3、根据接口使用规则,所有付费服务API接口,调用即产生次数累加/计费 4、支持电子发票,如需开票请务必联系客服并提交发票申请