來源:派臣科技|時間:2019-01-09|瀏覽:次
SEO培訓前言:1月28號,Nature雜志報道,Google旗下企業(yè)DeepMind(之前收購的)開發(fā)的一款名為 AlphaGo的人工智能,在2015年10月份以5:0戰(zhàn)勝歐洲圍棋冠軍,老職業(yè)二段樊麾。一石激起千層浪,人工智能最難戰(zhàn)勝人類的最后一個游戲,失守了,人工智能已經(jīng)達到職業(yè)圍棋水平了。
一時間,深度進修、機器進修、AlphaGo、神經(jīng)網(wǎng)絡等等這些觀念鋪天蓋地。Google不是搜索引擎嗎?這些東西和搜索,和SEO有何關聯(lián)?說說我的了解。
先聲明一下,下面涉及的深度進修等觀念,很可能我的了解和表述是極其粗淺的,甚至是謬誤的。固然我也是理工出身的,所學專業(yè)聽起來還挺艱深,微波與電磁場,但那是25年前的事啦。當前看技術內(nèi)容只能稀里糊涂理解個大約了。想理解準確小節(jié)的讀者,還是網(wǎng)上搜一下對照保險。
多層人工神經(jīng)網(wǎng)絡(artificial neural networks)模擬接近了人腦處理信息時從低層到高層不斷抽象化的進程。深度進修正是將低層特征分層抽象化為高層特征表達,原來的宗旨就是模擬多層神經(jīng)網(wǎng)絡。神經(jīng)網(wǎng)絡研討幾十年了,沉寂了一段時間,近幾年深度進修才又挖掘出其潛力。
深度進修的一個緊要特色是,它不需要人工輸入或標注特征,而是通過海量數(shù)據(jù)自動進修特征,也就是所謂無監(jiān)督進修(unsupervised learning)。所以大數(shù)據(jù)和深度進修也攪合在一起。
深度進修另一個特色是與詳盡范疇無關(domain independent),既能夠用在圍棋,也能夠用在搜索或其他方面。所以才會有這篇帖子。
Google、Facebook、百度在深度進修范疇都有許多進展,尤其是在人臉辨別、圖像辨別、語音辨別、翻譯等方面。這方面報道挺多的。
之前經(jīng)典的搜索排名算法是由工程師選取用哪些頁面特征(也就是排名原因)來排名,各個特征占多少權重,這些都是工程師決定并寫在程序里的,然后檢測效益,再更正。
以深度進修為基本的排名算法完全不是這么個進程。深度進修的手法是,用大量數(shù)據(jù)對程序?qū)嵭杏柧?,由程序自己進修應當用哪些特征來排名。換句話說,告訴深度進修排名算法,這些已知頁面是高質(zhì)量的,那些已知頁面是低質(zhì)量的,那究竟高質(zhì)量頁面應當有何特征呢?也就是面臨新頁面時該用哪些特征來排名?種種特征占多大比重?讓算法自己琢磨去。
1)Google現(xiàn)有經(jīng)典算法做檢測時的數(shù)據(jù)。搜索引擎正式上線新算法前都會做檢測的,給部分客戶返回新算法結(jié)果,然后監(jiān)測點擊率、跳出率、停留時間、頁面互動性、轉(zhuǎn)換率、更換查詢詞率等數(shù)據(jù),以判定新算法靈驗性。
2)Google有不少人工質(zhì)量評測員,而且老早就有,他們會評估特定頁面是高質(zhì)量還是低質(zhì)量。這些評測數(shù)據(jù)不徑直影響所評測頁面的排名,但會顯示出算法靈驗性。這些數(shù)據(jù)簡直就是現(xiàn)成的深度進修訓練數(shù)據(jù)。去年11月Google剛剛公開了最新版本的人工質(zhì)量評測指南,建議大家下載來瞧瞧。
如前所述,深度進修算法就是個黑箱啊,完全不用人工告訴它找什么特征,而是它自己進修該找什么特征,會找出什么特征誰也不知曉,一些特征可能人類壓根兒不會想到。很可能以后搜索引擎工程師也不知曉排名原因有哪些了,也不知曉一個頁面為何會有好的排名。再想一遍:連搜索引擎工程師也不知曉排名原因是什么。這和我們的常識、直覺是不是都有相當沖突了呢?
事實恰恰表明,能行。AlphaGo能戰(zhàn)勝圍棋職業(yè)二段,乍看起來,職業(yè)二段離人類頂尖高手還有很大差別??蓳Q個角度想,這世界上能達到職業(yè)二段的人類有幾個?記得前些天看報道,能贏職業(yè)二段的人類不超過1千個。
這種水平,能夠快樂地完虐我們幾十億人。我打了5,6年羽毛球,我前幾天剛剛9歲的女兒,在經(jīng)過4個月每周一次的業(yè)余訓練后,我要贏她必須很認真費勁了。這只是新加坡,只是一個業(yè)余教練,每周兩個小時,我無法想象,我們一般愛好者與職業(yè)水平的差別那是有多大。
站長、SEO們,少說這世界上大約得有個幾百萬吧?所以我們就是一般人。當前告訴我們,判定我們頁面質(zhì)量的算法,其判定力目前是所有人類的前1千名,年底可能是所有人類前10名。這是什么感覺?這是有點絕望的感覺--就別想著鉆空子啦。
2012年,Google Brain項目操作大量圖片對神經(jīng)網(wǎng)絡實行訓練,系統(tǒng)經(jīng)過訓練后能識別出:這是一只貓。緊要的是,沒有輸入貓長怎樣這類信息,是系統(tǒng)自己“領悟”了貓這個觀念。
AlphaGo將在3月份挑戰(zhàn)韓國九段、世界冠軍李世石。固然我基礎不懂圍棋,但樂觀估測一下吧,我覺得AlphaGo會贏。因素是,半年過去了,AlphaGo的訓練量又提升了幾千萬局棋譜,其棋力的增長不是線性的啊。
就我個人來講,深度進修對SEO的影響目前還不明朗,還需要一段時間觀察、考慮。以后有想法了再來交流。當前需要做好心理籌備,搜索引擎判定頁面質(zhì)量的準確度可能會有質(zhì)的飛躍,鉆空子的難度將大大提升。
估計還是有做中文SEO的心里在問,這對百度SEO()有卵用?。慷鄬憣懓俣劝??那么請考慮百度為何花大價錢組建百度深度進修研討院?肯定不是閑的了。百度把深度進修范疇最牛的人物之一、Google Brain項目創(chuàng)立人吳恩達都給挖來了。這個吳恩達高中還是在新加坡上的呢,萊佛士書院,第一名校。這里有吳恩達講機器進修的近20小時的線上教材。有互聯(lián)網(wǎng)真好,不然怎樣能輕松看到、聽到大師親自講課。
最后來點陰謀論。就在今天,Google搜索的最高負責人,Amit Singhal,辭職了。幾年前,他對排名算法中操作機器進修是一些排斥的。接替他的是誰呢?John Giannandrea,原Google人工智能部門的負責人。難道由工程師設計規(guī)則的算法已成過去,以深度進修為代表的人工智能算法要全面登上舞臺了?