国产在线一区二区三区-欧美成人伊人十综合色-国产激情视频在线播放-www视频免费看 ,日韩无码专区,亚洲日韩一页精品发布,国产精品992TV在线观看,AV狠狠色丁香婷婷综合久久

新聞中心

奇億動(dòng)態(tài) 新聞資訊建站指南網(wǎng)站優(yōu)化網(wǎng)絡(luò)營(yíng)銷(xiāo) 網(wǎng)頁(yè)設(shè)計(jì) 電子商務(wù) 網(wǎng)站運(yùn)營(yíng) 網(wǎng)絡(luò)創(chuàng)業(yè)

首頁(yè)>新聞中心>網(wǎng)站優(yōu)化

搜索引擎如何理解文件：論文件分析和語(yǔ)義聯(lián)系

添加時(shí)間：2013/9/17 10:43:14 編輯：奇億網(wǎng)站建設(shè)公司

在文件分析(document analysis)中，搜索引擎查看搜索詞是否出現(xiàn)在文件的重要區(qū)域——標(biāo)題、元標(biāo)簽、H標(biāo)簽和頁(yè)面文字。搜索引擎也根據(jù)文件分析和其他因素嘗試自動(dòng)衡量文件的質(zhì)量。對(duì)如今的搜索引擎來(lái)說(shuō)，僅僅依靠文件分析是不夠的，所以它們也要考慮語(yǔ)義聯(lián)系。
語(yǔ)義聯(lián)系(semantic connectivity)指的是通常相互關(guān)聯(lián)的詞或詞組。例如，當(dāng)你看到al。ha，就會(huì)把它和夏威夷聯(lián)系起來(lái)，而不是佛羅里達(dá)。搜索引擎構(gòu)建自己的同義詞庫(kù)和字典，幫助確定某些詞或話題之間有什么樣的關(guān)系。
搜索引擎可以掃描它們的網(wǎng)上內(nèi)容數(shù)據(jù)庫(kù)，使用模糊集合理論和某些方程式將詞語(yǔ)聯(lián)系起來(lái)，開(kāi)始像人類一樣理解頁(yè)面及網(wǎng)站。專業(yè)SEO人員不一定需要使用語(yǔ)義聯(lián)系測(cè)量工具來(lái)優(yōu)化網(wǎng)站，不過(guò)更高級(jí)的SEO人員會(huì)盡力充分利用每一個(gè)因素。
語(yǔ)義聯(lián)系測(cè)量對(duì)下面這些方面有幫助：
1、衡量選擇什么詞組作為目標(biāo)關(guān)鍵詞。
2、衡量有關(guān)某個(gè)話題的頁(yè)面上應(yīng)該包括什么關(guān)鍵詞組。
3、衡量其他高排名網(wǎng)站或網(wǎng)頁(yè)上的文字之間的關(guān)系。
4、尋找能提供相關(guān)主題鏈接的頁(yè)面。
這些資料技術(shù)性太強(qiáng)了，SEO人員只需要了解獲得有價(jià)值的信息的原則。要知道，雖然IR領(lǐng)域有成百上千個(gè)技術(shù)用語(yǔ)，其中很多難以理解，不過(guò)就算是SEO新手也可以區(qū)分和理解這些術(shù)語(yǔ)。
IR模型（搜索引擎）使用模糊集合理論（Lotfi Zadeh博士于1969年創(chuàng)建的模糊邏輯分支）來(lái)發(fā)現(xiàn)兩個(gè)詞之間的語(yǔ)義關(guān)系。IR系統(tǒng)并非使用同義詞典或字典來(lái)找出兩個(gè)詞之間是否有關(guān)系，而是使用自己的海量?jī)?nèi)容數(shù)據(jù)庫(kù)來(lái)推測(cè)出詞之間的關(guān)系。
這個(gè)過(guò)程雖然聽(tīng)起來(lái)復(fù)雜，但原理很簡(jiǎn)單。搜索引擎需要依靠機(jī)器邏輯（對(duì)／錯(cuò)、是／非等）判斷，機(jī)器邏輯相對(duì)人類有它的優(yōu)勢(shì)，但機(jī)器邏輯不能像人類一樣思考。對(duì)人類來(lái)說(shuō)很直觀的事情，對(duì)計(jì)算機(jī)來(lái)說(shuō)可能非常難以理解。
例如橘子和香蕉都是水果，但橘子和香蕉并不都是圓的。對(duì)人來(lái)說(shuō)這是很直觀的事情。機(jī)器要理解這一點(diǎn)以及其他與此類似的概念，語(yǔ)義聯(lián)系是關(guān)鍵。網(wǎng)上大量的人類知識(shí)可以被收錄進(jìn)索引庫(kù)，并且從中分析出人類已經(jīng)建立起來(lái)的聯(lián)系。
所以機(jī)器掃描索引庫(kù)中“香蕉”和“橘子”這兩個(gè)詞出現(xiàn)的地方，注意到“圓形”和“香蕉”很少同時(shí)出現(xiàn)，而“橘子’’和“圓形”經(jīng)常同時(shí)出現(xiàn)，機(jī)器就知道橘子是圓的，而香蕉不是圓的。
這就是模糊邏輯發(fā)揮作用的地方。只要分析詞語(yǔ)以何種頻率一起出現(xiàn)，在什么情況下一起出現(xiàn)，模糊集合理論就可以幫助計(jì)算機(jī)理解詞語(yǔ)之間是怎樣相關(guān)的。一個(gè)在此基礎(chǔ)上有所擴(kuò)展的相關(guān)概念是潛在語(yǔ)義分析(LSA,Latent Semantic Analysis)。
通過(guò)研究?jī)|萬(wàn)網(wǎng)頁(yè)的海量索引，搜索引擎可以“學(xué)習(xí)”哪些詞之間有聯(lián)系，哪些概念之間有聯(lián)系。例如，運(yùn)用LSA，搜索引擎能夠分辨前往ZOO（動(dòng)物園）的trips（旅途）活動(dòng)，經(jīng)常包括viewing wildlife（觀看野生生物）和animals（動(dòng)物），可能是一次tour（旅行）的一部分。
現(xiàn)在在Google搜索一下“-zoo～trips”，注意，返回結(jié)果中加黑體的詞與上一段中的英文單詞相匹配。Google將相關(guān)詞顯示為黑體，并且能夠辨認(rèn)出哪些詞在它們的索引庫(kù)中經(jīng)常同時(shí)出現(xiàn)（連在一起，在同一頁(yè)或比較靠近的位置）。
某些形式的LSA計(jì)算成本太高。現(xiàn)在的搜索引擎還不能像麻省理工學(xué)院的最新型學(xué)習(xí)計(jì)算機(jī)那樣聰明地學(xué)習(xí)。例如，搜索引擎無(wú)法從它們的索引庫(kù)中學(xué)到，斑馬和老虎都是帶條紋的動(dòng)物，雖然它們能意識(shí)到“條紋”和“斑馬”比“條紋”和“鴨子”更有語(yǔ)義關(guān)系。
潛在語(yǔ)義索引(LSI,Latent Semantic Indexing)將語(yǔ)義分析更進(jìn)一步，可以分辨相關(guān)聯(lián)的網(wǎng)頁(yè)。例如搜索引擎可能注意到一個(gè)頁(yè)面是關(guān)于doctor的，另一個(gè)頁(yè)面是關(guān)于physician的，根據(jù)這兩個(gè)頁(yè)面上經(jīng)常共同出現(xiàn)的其他詞，搜索引擎認(rèn)定這兩個(gè)頁(yè)面有一定關(guān)系。
所以，搜索physician時(shí)，談?wù)揹octor的頁(yè)面也可能出現(xiàn)。搜索引擎公司在這些技術(shù)上投資已經(jīng)很多年了。例如，2003年4月Google收購(gòu)了Applied Semantics，這是一個(gè)以其語(yǔ)義文字處理技術(shù)聞名的公司。
這個(gè)技術(shù)現(xiàn)在用于Google AdSense的廣告系統(tǒng)中，也很有可能在核心搜索算法中使用。這些應(yīng)用使我們認(rèn)識(shí)到搜索引擎怎樣分辨網(wǎng)上詞匯、詞組以及概念之間的聯(lián)系。隨著語(yǔ)義聯(lián)系成為搜索引擎算法越來(lái)越重要的部分，可以預(yù)期，頁(yè)面、網(wǎng)站和鏈接的主題將會(huì)越來(lái)越受重視。
未來(lái)搜索引擎將更有能力理解概念和主題，分辨哪些內(nèi)容、鏈接、頁(yè)面與整個(gè)網(wǎng)站的主題不太吻合。

中文字幕人妻中文AV不卡专区,狠狠色狠狠色综合日日不 国产激情一区二区三区在线观看_日韩精品免费电影_亚洲

搜索引擎如何理解文件：論文件分析和語(yǔ)義聯(lián)系

中文字幕人妻中文AV不卡专区,狠狠色狠狠色综合日日不国产激情一区二区三区在线观看_日韩精品免费电影_亚洲