發表文章

目前顯示的是 9月, 2016的文章

[Python] crawler func HTMLParser

承襲前篇的 submitter ,這篇就來講一下如何看送出去的結果。 我們要做的就是抓取網頁,然後分析出其中我們要的資料,然後簡潔的 show 出來。 廢話不多說,先引入函式庫。 import urllib2 # 一樣,抓網頁用的 from HTMLParser import HTMLParser #分析字串用的 接下來,來實作一下 Parser 繼承剛剛引入的 HTMLParser 類別。 HTMLPraser 中,我使用其中三個 method 就能完成這項任務,主要是實作這三個函式。( 其他函式 )     def handle_starttag(self , tag , attrs)     # 他會讀到開頭的tag , tag 是 html tag 類型 如 h1 , td , div ; attrs 是個 list 裡面有 屬性 map 值的關係     def handle_data(self , data)     # 他會讀到 開頭的 tag 和 結尾的 tag 之間的內容 ,    # 但由於沒有 tag 變數可供辨別,所以我用上面的 starttag 立個 flag     def handle_endtag(self , tag)     # 就是讀到結尾的 tag     先繼承HTMLParser類別 class rsParser(HTMLParser): 建構子來個初始化     def __init__(self):         HTMLParser.__init__(self) #呼叫父類別物件建構子         self.getData = False         self.lastTag = ""         self.probID = "" 實作 handle_starttag 函式     def handle_starttag(self , tag , attrs):         self.lastTag = tag # 為 handle_data 立 flag         if tag == "td":             for(attr , value) in attrs: # 算是從 map List 中 解開 map 拿出來用

[Antergos] 筆電安裝及其中文化設定(一更)

圖片
=動機= 這篇是用Antergos打出來的 ww 可能是最近看了Mr. Robot的關係 ,想把作業系統改爲Linux 。 原本就對windows有些意見 ,要試試 kali 時 ,虛擬機又 run 不起來 ,這讓我徹底怒了 。 (前天win10更新又搞死虛擬機) 本來想要把整個硬碟刷掉,但老爸建議買一塊硬碟來裝就好,於是乎就買了塊來裝了。 把原本的拆下,裝上新的,決定來裝 Arch Linux 來折疼一下,結果搞了半天,又換 Kali 也裝不起來 , 最後找到了 Arch 的派生版 Antergos 也 QQ ... 回到宿舍,想說再來一次,用接 USB 的方式 直接裝,沒想到就成了! 因為重裝了三次 Arch (都是死在可恨的GUI) 對 pacman 已經有一定的熟練度了,所以用起 Antergos來格外順手~ (第一次Arch desktop manager 選 lightdm -> 死      二                                         選    slim   -> 死      三                                         選 gdm     -> 活   -> Xfce 死                                                                               -> gnome 載半天,果斷關掉不搞了) =正文= Antergos 的安裝格外簡單,找 載點 下 iso 。 (載點藏在 tab 中,害我還找了一下 XDD),看你要載完整板還是簡化板,我是載完整板。 把 iso 檔副檔名改成 img (Win32DiskImager 才讀的到) 使用 Win32DiskImager 拷進 usb , 筆電 win10 關機加 shift 鍵(按住 shfit 滑鼠點關機) esc 按住,再按開機鍵,進入 bios 選單。選裝著 antergos 的 usb 。 (其他 windows 版本看要怎麼進 bios 囉~,因為 win10 有快速開機,不按 shif