示爱对联
发布时间:2019-07-30 15:52:02
作者:xhs
阅读:871
示爱对联:1.互信息和信息熵的概念2算法流程3代码执行1.互信息和信息熵的概念1.1相互信息相互信息反映了两个变量之间的相互依赖程度。二元互信息是指两个事件之间的相关量,计算公式如下:图像。巴布亚新几内亚互信息值越大,x和y之间的相关性越高,x和y形成短语的概率越高。反之,互信息值越低,x和y之间的相关性越低,x和y之间存在短语边界的概率越高。公式中的x和y是两个相邻的词,p值是其发生的概率。例如,“算法→研究”出现了两次,二阶短语总共有191个,所以p(x,y)=2/191。用同样的逻辑,我们可以算出x的p,y的p。这样,可以计算所有二阶短语的相互信息,并对其进行排序,以获得短语及其mi值和相互信息值。1.2信息熵术语熵表示一个随机变量的不确定性度量。一般来说,如果x是一个具有有限数值的随机变量(或x是离散事件的有限数值的概率场),x的概率是p(x),那么x的熵定义为:图像。巴布亚新几内亚左右熵是指左边界的熵,右边界的熵用多个词表示。左右熵公式如下:图像。巴布亚新几内亚你要做的是,取左边的熵,取一个字符串左边所有可能的单词,然后把它们加起来。如果熵为零,那意味着只有一条路可以走。2算法流程该算法主要选择互信息和熵两种统计信息,从字串的内外边界提取词组。早期的分词、权重、过滤等预处理不说。2.1搜索种子词需要计算的域词(目标域词)和其他域词列表中的词首先按频率排序。然后将目标域词列表和其他域词列表导入到同一数据表中,对两个表中同一词的排名排名值进行划分。根据目标域单词列表中排名比设置的阈值提取单词。采用上述秩比法提取域种子词。最后,我们将目标字段和其他字段共享的频率顺序前5000个字作为该字段的种子字。2.2内边界的确定方法(二阶互信息最有效)从统计学的角度来看,词与词之间的整合程度取决于共现的频率。如果有大量的词串重复匹配,也就是说,它们的共存频率越高,词串的组合就越紧密。因此,高频字串可以是一个完整的多字表达式。详细计算方法如上所述。2.3外边界的确定方法用熵度量,左右熵是指左边界的熵,右边界的熵用多个词表示。示例:w代表n-gram单词串,w=w 1,w 2…W N。A是出现在字符串左侧的所有单词的集合,A是出现在左侧的单词;B是出现在字符串右侧的所有单词的集合,B是出现在右侧的单词。如果单词串的el和er值较大,也就是说,单词串w周围出现的单词越多,w更可能是一个完整的多单词表达式。3代码执行结束示爱对联
版权声明:本文内容由互联网用户投稿整理编辑发布,不拥有所有权,不承担应有相关法律责任。如果文章、图片有涉嫌抄袭的内容,请发送到邮箱举报,且提供抄袭的相关证据,一但查实,会在24小时删除涉嫌侵权内容。
猜您喜欢

想知道女生是不是喜欢你,教用一个问题测试她喜欢你的方法:你可以对她说一句话:你好像长胖了一点?(看看女生是什么反应。不过如果男生问出这个问题,可能让女生觉得你情商低,就算女生喜欢你也有一定的风险性)
2024-02-20

如果男生犯了错惹女朋友生气,那就一定要想办法哄好她,因为是你错了呀。而想要哄好生气的女朋友,那你一定要认识到自己的错误,下面给大家分享惹女朋友生气检讨书1000字,希望能够帮助你哄好你的女朋友。
2024-02-19

如果女朋友说分手后做朋友是什么意思呢?如果是还爱着对方那就不应该选择分手,如果是不爱了那大家就应该彻底断了联系,真正深爱过的人是不可能在分手后做朋友的。下面就来分析女朋友的心理。
2024-02-18
脱单神器

安卓版蜜小助APP
iOS版蜜小助APP
20W+可复制撩妹话术
实战案例+话术+视频+教程
热门文章

口述:公公在梳妆台上给我数次高潮
2013-11-11
1069065

二宮琴美、東熱出操翻白眼昏死
2015-03-14
78328

那个午夜 禽兽继父将我压在身下
2014-04-08
78054

韩国美女主播”钟淑”高清视频精品合集9部 115网盘在线观看
2015-03-11
77288

店长推荐作品 EMP-001 EMPIRE Vol.1 50 波多野结衣 50连发泼溅中 2012年
2015-03-19
75774

留守女人和禽兽公公的不伦性事
2013-12-28
74937

美国男人让我一夜高潮五次
2014-04-29
69845

关牧村与前夫王星军离婚真正原因 关牧村前夫王星军照片家庭背景及个人资料
2014-08-15
64941

公公的精湛床技让我死去活来
2014-04-08
56763

我和小姨子在车上疯狂嘿咻
2013-12-28
56566