优秀的毕业设计论文网
计算机 JAVA 电子信息 单片机 机械机电 模具 土木工程 建筑结构 论文
热门搜索词:网络 ASP.NET 汽车 电气 数控 PLC

中文分词算法的研究

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
  
资料介绍:

摘要

在中文搜索引擎中,中文分词的作用显而易见,其结果直接影响到搜索引擎的性能。当前的中文分词主要有三类方法:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。中文分词发展过程中遇到最大的问题是歧义识别和新词识别。中文分词的未来发展方向既要解决这类问题,使得达到较高的分词正确率,又要进行行业分词不断拓展中文分词的应用范围,本文主要研究分词中的最大匹配算法。 内容来自think58 [版权所有:http://think58.com]

关键词:中文分词 研究进展 概率 新词识别

Summary
In the Chinese search engine, the role of Chinese word segmentation is obvious, and the results directly affects the performance of search engines. The current Chinese word there are three main ways: the word on the sub-string matching methods, methods based on understanding of the word and word-based statistical methods. Chinese word encountered in the development of the biggest problems is ambiguous to identify and recognize new words. Chinese Word of the future direction is necessary to solve such problems, making the correct word to a higher rate, but also for the industry continued to expand Chinese word segmentation range of applications, this paper studies the maximum word matching algorithm.
Keywords: Chinese word segmentation probability of a new word recognition research