專做系統家具、系統櫃 客製化流暢舒適居家,免費估價規劃 | 全系列活動百葉窗.防火安全門.氣密隔音窗 堅固耐用.工廠直營.歡迎洽詢 |
[教學]用 Apache 拒絕網路流氓的騷擾 |
房東:貓貓 發表時間:2010-06-01 | [檢舉] |
User-agent: abc Disallow: /not_for_abc/ User-agent: * Disallow: /secret/ 意思是禁止 abc 這個 robot 捉 /not_for_abc/ 目錄,及禁止所有的 robots 捉 /secret/ 目錄. 網站管理者理論上可以將不喜歡的 robot,或是禁止 robot 捉取的目錄或檔案,寫在這個檔案中. 但是這個只防君子不防小人,碰到網路流氓就沒轍了,有些搜尋引擎的 robot 根本不看網站的 robots.txt,就一路抓下去,實在另人髮指. 網路流氓是什麼,就是這些不遵守遊戲規則,到處亂捉別人網站的內容的壞蛋,這樣會造成網站的流量增加,也就是費用的增加,或是不想被搜尋的資料也被捉走了,侵犯網站的隱私. 很可惡是吧. 下面是幾個例子: iaskspider 是「愛問」屬於中國新浪網的 robot,完全不管 robots.txt QihooBot,也是來自中國的「奇虎網」,也是垃圾一個,浪費一堆頻寬,來源 IP 有很多個: 另有 larbin,iearthworm,yodaoice,lanshanbot,Outfoxbot 等等一堆,到網路上徵信一下,這些通通不是什麼好東西,還有一個 WebClipping.com 不知是好人壞人… 碰到這種網路流氓,說實在的也沒什麼積極的辦法,不能叫網路警察把它捉起來...不過消極的辦法還是有的,把網站門戶看好 — Apache 可以擋住特定 IP,但因為 robots 大多有多重 IP,過濾壞蛋的姓名比較有效,可以用 BrowserMatchNoCase 來過濾,用法像是: 複製程式 Order allow,deny Allow from all BrowserMatchNoCase \"iaskspider\" badguy BrowserMatchNoCase \"QihooBot\" badguy BrowserMatchNoCase \"larbin\" badguy deny from env=badguy 如此,它們就會收到 Apache 丟回 403 碼:Forbidden 但是,有些更沒品的還會隱姓埋名,不敢用真面目見人的… |
廣利不動產-板橋在地生根最實在--新板特區指名度最高、值得您信賴的好房仲 完整房訊,房屋、店面熱門精選物件,廣利不動產 優質仲介,房屋租賃、買賣資訊透明,交易真安心! 廣利不動產-新板特區指名度最高、值得您信賴的好房仲 您的托付,廣利用心為您服務 |