python為什么叫爬蟲(chóng)
發(fā)布時(shí)間:2019-11-14爬蟲(chóng)一般是指網(wǎng)絡(luò)資源的抓取,因?yàn)閜ython的腳本特性,易于配置,對(duì)字符的處理也非常靈活,加上python有豐富的網(wǎng)絡(luò)抓取模塊,所以?xún)烧呓?jīng)常聯(lián)系在一起。
python為什么叫爬蟲(chóng)爬蟲(chóng),即網(wǎng)絡(luò)爬蟲(chóng),大家可以理解為在網(wǎng)絡(luò)上爬行的一只蜘蛛,互聯(lián)網(wǎng)就比作一張大網(wǎng),而爬蟲(chóng)便是在這張網(wǎng)上爬來(lái)爬去的蜘蛛,如果它遇到自己的獵物(所需要的資源),那么它就會(huì)將其抓取下來(lái)。比如它在抓取一個(gè)網(wǎng)頁(yè),在這個(gè)網(wǎng)中他發(fā)現(xiàn)了一條道路,其實(shí)就是指向網(wǎng)頁(yè)的超鏈接,那么它就可以爬到另一張網(wǎng)上來(lái)獲取數(shù)據(jù)。
因?yàn)閜ython的腳本特性,python易于配置,對(duì)字符的處理也非常靈活,加上python有豐富的網(wǎng)絡(luò)抓取模塊,所以?xún)烧呓?jīng)常聯(lián)系在一起。
Python爬蟲(chóng)開(kāi)發(fā)工程師,從網(wǎng)站某一個(gè)頁(yè)面(通常是首頁(yè))開(kāi)始,讀取網(wǎng)頁(yè)的內(nèi)容,找到在網(wǎng)頁(yè)中的其它鏈接地址,然后通過(guò)這些鏈接地址尋找下一個(gè)網(wǎng)頁(yè),這樣一直循環(huán)下去,直到把這個(gè)網(wǎng)站所有的網(wǎng)頁(yè)都抓取完為止。
python爬蟲(chóng)的應(yīng)用系統(tǒng)編程:提供API(Application Programming Interface應(yīng)用程序編程接口),能方便進(jìn)行系統(tǒng)維護(hù)和管理,Linux下標(biāo)志性語(yǔ)言之一,是很多系統(tǒng)管理員理想的編程工具 。
圖形處理:有PIL、Tkinter等圖形庫(kù)支持,能方便進(jìn)行圖形處理。
數(shù)學(xué)處理:NumPy擴(kuò)展提供大量與許多標(biāo)準(zhǔn)數(shù)學(xué)庫(kù)的接口。
Web編程:應(yīng)用的開(kāi)發(fā)語(yǔ)言,支持最新的XML技術(shù)。
多媒體應(yīng)用:Python的PyOpenGL模塊封裝了“OpenGL應(yīng)用程序編程接口”,能進(jìn)行二維和三維圖像處理。PyGame模塊可用于編寫(xiě)游戲軟件。
pymo引擎:PYMO全稱(chēng)為python memories off,是一款運(yùn)行于Symbian S60V3,Symbian3,S60V5, Symbian3, Android系統(tǒng)上的AVG游戲引擎。因其基于python2.0平臺(tái)開(kāi)發(fā),并且適用于創(chuàng)建秋之回憶(memories off)風(fēng)格的AVG游戲,故命名為PYMO。