教父经典英文台词
发布时间:2019-08-08 20:17:28
作者:xhs
阅读:763
教父经典英文台词:本文主要阐述了图片库中英标汉标翻译中存在的问题及解决办法。一、问题的背景和来源业务背景东方IC(现为头条子公司)是一家图片版权销售网站,致力于保护和传播第三方或个人的优质图片资源,快速向需求方展示和推荐,促进快速生产、传播和我们的发展。互联网上的图片资源。东方IC拥有数以千万计的高品质编辑和创意图片,不仅服务于标题编号、商业化、问答等大业务线,还欢迎其他企业利用东方IC的资源获取海量的高品质图片。扩展业务维度,帮助业务发展。工作背景我的工作是参与东方IC网站的图片搜索系统,了解如何将海量图片资源与每个需求方的各种图片需求相匹配,找到图片与需求之间的最短路径。我们致力于快速为用户提供最合适的图片资源,减少用户搜索资源的时间和成本,提高用户从搜索到使用的转化率,从而增加网站的交易量。翻译背景目前,图像搜索主要有两种方式,一种是按图像搜索,即查找和图片结构、颜色、大小、构成、内容等类似于图片资源的特征。另一个是关键字搜索。将描述性文本标签应用于图像,并通过描述性文本(查询)表达用户的图像要求。通过查找标签和查询之间的连接,用户可以找到最符合用户需求的图像资源。翻译的原因是国外市场的东方IC资源库中有大量图片资源,这些图片资源的原始标签用外语(英语)描述。如果你想在中国销售并为国内用户提供搜索服务,你需要将这些英文标签翻译成中文。二.翻译中的困难和失败翻译中的困难英语单词和汉语单词不能一一对应。一个英语单词常常对应一组不同意思的汉语单词。例如,英语wJavae可以翻译成wJavae、wJavae、wJavae,而这些词在汉语中是无关的。如何在特定的情况下将英语单词翻译成具体、恰当的汉语单词,是本文要解决的问题和难点。下面是一些翻译工作失败的例子,从中我们也可以看到翻译工作对业务有很大的影响。故障案例1下面是在helo中搜索关键字“wJavae”,但返回了大量与wJavaes相关的图像。搜索和显示完全不同,大大降低了产品的用户体验和技术得分。搜索错误是由于将代表波浪图像的英文标记“wJavae”翻译为“wJavae”而引起的。图像故障案例2这是在helo中搜索“bat”的结果,你可以看到在返回结果中,与这些“棒球”的无关图片混合在一起,因为英语“bat”原来的意思是“棒球”被翻译成“bat”。图像故障案例3下面的图片是在东方IC中搜索“gum”,但它与“gum”的图片混合在一起,因为“gum”的英文单词已翻译为“gum”。图像可以看出,英文标签翻译的失败很常见,容易出错,翻译失败的影响也很大,不仅降低了用户体验,而且降低了用户对产品的技术等级。三、问题思路及解决办法思想问题一个英文单词常常对应几个中文单词。简单地说,从字面上来说,把英语单词翻译成任何中文单词都是没有问题的,这是标准答案。这是由不同的语言点引起的。问题是,在特定的情况下,例如在一个句子或一篇文章中,某个英语只能代表一个中文意思。例如,在上诉失败的情况下,这里的场景是一幅图片,一幅图片可以覆盖很多东西,甚至可以是一篇文章来描述它,所以它本身就是一个上下文,在这个上下文中每个英语单词都有一个特殊的含义,所以这里没有自由翻译一个英语单词。在它的中文单词中有一个候选词。我们想了解一个具体的英语使用场景,发现在这个场景中,英语代表着特定的意义,应该从它的环境出发,从它的近处出发,具体地从英语单词周围出发,根据单词周围的单词,单词周围的影响或决定它的位置和意义,所以用词与周围具体翻译的候选词中的任何一个(胖男人里面胖更多的朋友->谁是更多的朋友胖男人,谁是最大的胖概率是<:)。场景1:简单的语义场景理解方案一需要事先准备一份中英文翻译规则表,其中包含以下属性:需要翻译的英文单词、语义场景相关单词和中文候选单词。示例如下:图像实现步骤:在翻译wJavae这个词时,如果在其他关键字中包含场景相关词,则该词将被翻译成与场景相关词相对应的中文。例如:wJavae出现在图像的关键字中,而wJavae还有其他关键字,如海滩、海洋或游泳。有理由把波转换成波而不是波。优势:设计原理简单易懂。只要规则表单准备好了,并且您可以在翻译时简单地查询它,解决方案就很容易使用。缺点:准备工作是巨大的,需要大量的人力来编制一份中英文通用规则清单。准确度不高,场景关联词翻译成英语的数量巨大,不容易筛选出满足翻译需要的词。例如,关联词太少会导致图片标签缺失,关联词太多会导致关联词同时出现。方案二:word2vec方案二,原理与方案一相似,它是在方案一中,在进一步扩展和定量的基础上,或者利用其他所有关键词的图片来构建语义场景,决定英语单词的翻译方向,但这里我们将每个单词的语义场景转换成浮动的POI。用NT矢量表示,便于实现,且具有较高的精度。这里将词义场景转换为浮点向量,采用机器学习的开放源码模型:word2vec,word2vec是采用双层神经网络对文本进行处理的,其输入是文本语料库,例如:搜索所有文章,人民日报头条新闻Medi一篇文章,输出是一组向量,语料库代表一个巨大的语义环境,在语义环境中,每个词都有一个属于自己位置的空间,以及一组向量标记的位置。其中,动物和猴载体的相似性高于动物和桌子。这里是从标题文章的语料库中训练出来的单词“preference”和“excellence”的浮点向量,表示它们在语料库上下文中的各自位置。图像在此上下文中计算两个词之间的距离。这里采用的相似性是余弦相似性,其含义如下:图像以下用于计算余弦相似性的python代码可以使用原始数学库或numpy库实现:图像图像下面是使用方案2的一个例子,它显示了由两种不同情况下的wJavae候选词列表计算出的相似性值:图像图像可以看出,在不同的语义环境中,wJavae候选词与场景相关词的相似性是不同的,而相似性最高的候选词是“相对”准确的翻译结果。方案二具体实施过程:通过图像库,依次获取每个图像的属性信息,尤其是英文描述性标签。调用云有道API接口,将每个英文标签转换成中文候选词列表。对于每个英文标签和对应的候选词列表,计算并总结每个候选词和所有其他候选词列表之间的余弦相似性。选取相似度最大的候选词作为翻译目标,剔除其余候选词。依次计算每个英文标签,直到翻译完所有英文标签。完整的计算代码如下:图像图像结果显示:图像教父经典英文台词
版权声明:本文内容由互联网用户投稿整理编辑发布,不拥有所有权,不承担应有相关法律责任。如果文章、图片有涉嫌抄袭的内容,请发送到邮箱举报,且提供抄袭的相关证据,一但查实,会在24小时删除涉嫌侵权内容。
猜您喜欢
想知道女生是不是喜欢你,教用一个问题测试她喜欢你的方法:你可以对她说一句话:你好像长胖了一点?(看看女生是什么反应。不过如果男生问出这个问题,可能让女生觉得你情商低,就算女生喜欢你也有一定的风险性)
2024-02-20
如果男生犯了错惹女朋友生气,那就一定要想办法哄好她,因为是你错了呀。而想要哄好生气的女朋友,那你一定要认识到自己的错误,下面给大家分享惹女朋友生气检讨书1000字,希望能够帮助你哄好你的女朋友。
2024-02-19
如果女朋友说分手后做朋友是什么意思呢?如果是还爱着对方那就不应该选择分手,如果是不爱了那大家就应该彻底断了联系,真正深爱过的人是不可能在分手后做朋友的。下面就来分析女朋友的心理。
2024-02-18
脱单神器
安卓版蜜小助APP
iOS版蜜小助APP
20W+可复制撩妹话术
实战案例+话术+视频+教程
热门文章
口述:公公在梳妆台上给我数次高潮
2013-11-11
1069065
二宮琴美、東熱出操翻白眼昏死
2015-03-14
78328
那个午夜 禽兽继父将我压在身下
2014-04-08
78054
韩国美女主播”钟淑”高清视频精品合集9部 115网盘在线观看
2015-03-11
77288
店长推荐作品 EMP-001 EMPIRE Vol.1 50 波多野结衣 50连发泼溅中 2012年
2015-03-19
75774
留守女人和禽兽公公的不伦性事
2013-12-28
74937
美国男人让我一夜高潮五次
2014-04-29
69845
关牧村与前夫王星军离婚真正原因 关牧村前夫王星军照片家庭背景及个人资料
2014-08-15
64941
公公的精湛床技让我死去活来
2014-04-08
56763
我和小姨子在车上疯狂嘿咻
2013-12-28
56566