久久精品五月,日韩不卡视频在线观看,国产精品videossex久久发布 ,久久av综合

站長資訊網
最全最豐富的資訊網站

掌握PHP 爬取網頁的主要方法

掌握PHP 爬取網頁的主要方法

主要流程就是獲取整個網頁,然后正則匹配(關鍵的)。

PHP抓取頁面的主要方法,有幾種方法是網上前輩的經驗,現在還沒有用到的,先存下來以后試試。

1.file()函數

2.file_get_contents()函數

3.fopen()->fread()->fclose()模式

4.curl方式 (本人主要用這個)

5.fsockopen()函數 socket模式

6.插件(如:http://sourceforge.net/projects/snoopy/)

7.file()函數

<?php //定義url $url='[http://t.qq.com](http://t.qq.com/)';//fiel函數讀取內容數組 $lines_array=file($url);//拆分數組為字符串 $lines_string=implode('',$lines_array);//輸出內容 echo $lines_string; 

2.使用file_get_contents方法實現,比較簡單。

使用file_get_contents和fopen必須空間開啟allow_url_fopen。方法:編輯php.ini,設置 allow_url_fopen = On,allow_url_fopen關閉時fopen和file_get_contents都不能打開遠程文件。

$url="[http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml](http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml)"; $html=file_get_contents($url); //如果出現中文亂碼使用下面代碼` //$getcontent = iconv("gb2312", "utf-8",$html); echo"<textarea style='width:800px;height:600px;'>".$html."</textarea>";

3.fopen()->fread()->fclose()模式 ,目前還沒用過,看到了就先記下了

<?php //定義url $url='[http://t.qq.com](http://t.qq.com/)';//fopen以二進制方式打開  $handle=fopen($url,"rb");//變量初始化 $lines_string="";//循環讀取數據 do{ $data=fread($handle,1024);   if(strlen($data)==0) {` break;  }  $lines_string.=$data; }while(true);//關閉fopen句柄,釋放資源 fclose($handle);//輸出內容 echo $lines_string;

4.使用curl實現(本人一般使用這個)。

使用curl必須空間開啟curl。方法:windows下修改php.ini,將extension=php_curl.dll前面的分號去掉,而且需 要拷貝ssleay32.dll和libeay32.dll到C:WINDOWSsystem32下;Linux下要安裝curl擴展。

<?php header("Content-Type: text/html;charset=utf-8"); date_default_timezone_set('PRC'); $url = "https://***********ycare";//要爬取的網址 $res = curl_get_contents($url);//curl封裝方法 preg_match_all('/<script>(.*?)</script>/',$res,$arr_all);//這個網頁中數據通過js包過來,所以直接抓js就可以 preg_match_all('/"id":"(.*?)",/',$arr_all[1][1],$arr1);//從js塊中匹配要的數據 $list = array_unique($arr1[1]);//(可省)保證不重復 //以下則是同理,循環則可 for($i=0;$i<=6;$i=$i+2){   $detail_url = 'ht*****em/'.$list[$i];   $detail_res = curl_get_contents($detail_url);   preg_match_all('/<script>(.*?)</script>/',$detail_res,$arr_detail);   preg_match('/"desc":"(.*?)",/',$arr_detail[1][1],$arr_content);   ***     ***     ***   $ret=curl_post('http://**********cms.php',$result);//此腳本未放在服務器上,原因大家懂就好哈。 } function curl_get_contents($url,$cookie='',$referer='',$timeout=300,$ishead=0) {   $curl = curl_init();   curl_setopt($curl, CURLOPT_RETURNTRANSFER,1);   curl_setopt($curl, CURLOPT_FOLLOWLOCATION,1);   curl_setopt($curl, CURLOPT_URL,$url);   curl_setopt($curl, CURLOPT_TIMEOUT,$timeout);   curl_setopt($curl, CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36');   if($cookie)   {     curl_setopt( $curl, CURLOPT_COOKIE,$cookie);   }   if($referer)   {     curl_setopt ($curl,CURLOPT_REFERER,$referer);   }   $ssl = substr($url, 0, 8) == "https://" ? TRUE : FALSE;   if ($ssl)   {     curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);     curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);   }   $res = curl_exec($curl);   return $res;   curl_close($curl); } //curl post數據到服務器 function curl_post($url,$data){   $ch = curl_init();   curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);   //curl_setopt($ch,CURLOPT_FOLLOWLOCATION, 1);   curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);   curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36');   curl_setopt($ch,CURLOPT_URL,$url);   curl_setopt($ch,CURLOPT_POST,true);   curl_setopt($ch,CURLOPT_POSTFIELDS,$data);   $output = curl_exec($ch);   curl_close($ch);   return $output;  } ?>

5.fsockopen()函數 socket模式(沒用過,以后可以試試)

socket模式能否正確執行,也跟服務器的設置有關系,具體可以通過phpinfo查看服務器開啟了哪些通信協議

<?php $fp = fsockopen("t.qq.com", 80, $errno, $errstr, 30); if (!$fp) {   echo "$errstr ($errno)<br />n"; } else {   $out = "GET / HTTP/1.1rn";   $out .= "Host: t.qq.comrn";   $out .= "Connection: Closernrn";   fwrite($fp, $out);   while (!feof($fp)) {     echo fgets($fp, 128);   }   fclose($fp); }

6.snoopy插件,最新版本是Snoopy-1.2.4.zip Last Update: 2013-05-30,推薦大家使用

使用網上非常流行的snoopy來進行采集,這是一個非常強大的采集插件,并且它的使用非常方便,你也可以在里面設置agent來模擬瀏覽器信息。

說明:設置agent是在 Snoopy.class.php 文件的第45行,請在該文件中搜索 “var 公式輸入有誤_SERVER['HTTP_USER_AGENT']; 可以得到瀏覽器信息,將echo出來的內容復制到agent里面就可以了。

<?php //引入snoopy的類文件 require('Snoopy.class.php'); //初始化snoopy類 $snoopy=new Snoopy; $url="[http://t.qq.com](http://t.qq.com/)"; //開始采集內容` $snoopy->fetch($url); //保存采集內容到$lines_string $lines_string=$snoopy->results; //輸出內容,嘿嘿,大家也可以保存在自己的服務器上 echo $lines_string;

推薦相關學習:php圖文教程

贊(0)
分享到: 更多 (0)
?
網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
久久精品五月,日韩不卡视频在线观看,国产精品videossex久久发布 ,久久av综合
中文不卡在线| 波多视频一区| 久久久久久久久99精品大| 久久a爱视频| 欧美激情综合| 国产成人精品三级高清久久91| 国产精品嫩草影院在线看| 国产麻豆精品久久| 国产高清日韩| 欧美激情另类| 美女性感视频久久| 麻豆91在线播放| 伊人久久高清| 亚洲精品一区二区在线看| 欧美天堂亚洲电影院在线观看| jiujiure精品视频播放| 日韩影院精彩在线| 国产精品日本一区二区不卡视频 | 精品视频国内| 激情欧美亚洲| 亚洲精品欧美| 激情中国色综合| 精品日韩一区| 黑丝美女一区二区| 日韩中文字幕| 国产不卡人人| 亚洲欧美网站在线观看| 高清日韩欧美| 午夜视频一区二区在线观看| 精品一区二区三区中文字幕视频| 欧美午夜精彩| 国产精品日本一区二区三区在线 | 欧洲一级精品| 91精品韩国| 欧美亚洲三级| 影院欧美亚洲| 高清一区二区| 国产精品一级在线观看| 国产亚洲毛片在线| 在线观看精品| 国产精品magnet| 亚久久调教视频| 亚洲欧美日韩国产综合精品二区| 精品一区二区三区在线观看视频| 美日韩精品视频| 1024精品一区二区三区| 麻豆精品在线| 日韩av不卡在线观看| 涩涩av在线| 成人午夜网址| 久久精品 人人爱| 亚洲1区在线| 亚洲精品国产精品粉嫩| 红桃视频国产精品| 免费久久精品| 国产成人77亚洲精品www| 欧美一区=区三区| 免费中文字幕日韩欧美| 精品免费av在线| 成人片免费看| 在线天堂中文资源最新版| 国产精品久久久久久久久免费高清 | 国产高清一区二区| 国产精品成人a在线观看| 日韩和欧美的一区| 五月亚洲婷婷 | 成人在线丰满少妇av| 久久国产免费看| 日韩国产在线观看| 日韩在线黄色| 免费在线欧美视频| 日韩午夜黄色| 免费人成黄页网站在线一区二区| 偷拍欧美精品| 免播放器亚洲| 亚洲三级网站| 天堂久久av| 69精品国产久热在线观看| 亚洲日本在线观看视频| 一区二区精品| 国产欧美日韩亚洲一区二区三区| 国产日韩欧美中文在线| 美女国产一区二区三区| www在线观看黄色| 久久久久国产一区二区| 99久久久久国产精品| 影视先锋久久| 亚洲2区在线| 久久精品二区亚洲w码 | 999国产精品| 国产婷婷精品| 欧美日韩视频免费看| 麻豆精品99| 欧美日韩高清| 日本欧美韩国一区三区| 成人午夜亚洲| 丝袜美腿一区二区三区| 午夜视频一区二区在线观看| 日韩国产在线一| 国产一区二区三区国产精品| 久久国产主播| 欧美亚洲综合视频| 日韩国产欧美| 日韩中文字幕在线一区| 在线看片国产福利你懂的| 国产毛片久久| 精品视频在线观看网站| 亚洲免费在线| 国产精品国产一区| 中文精品电影| 欧美成人基地 | 中文日韩在线| 四虎国产精品免费观看| 亚洲无线观看| 999久久久国产精品| 亚洲精品2区| 久久国产电影| 精品三级国产| 在线观看视频免费一区二区三区| 国产一区2区在线观看| 亚洲在线网站| 超级白嫩亚洲国产第一| 综合一区av| 99在线|亚洲一区二区| 日韩欧美看国产| 你懂的国产精品永久在线| 日本成人中文字幕| 蜜桃久久久久久| 亚洲激情社区| 免费欧美一区| 久久久蜜桃一区二区人| 日韩成人免费| 里番精品3d一二三区| 国产精品一区二区中文字幕| 日本午夜精品久久久久| 亚洲尤物在线| 欧美专区18| 蜜桃久久精品一区二区| 久久一二三区| 中文字幕视频精品一区二区三区| 午夜精品免费| 四虎精品永久免费| 日韩高清在线一区| 欧美亚洲二区| 卡一卡二国产精品| 日韩精品永久网址| 日本一区二区三区中文字幕| 日韩精品一级中文字幕精品视频免费观看 | 精品免费视频| 精品日本视频| 99久久激情| 中国女人久久久| 在线日韩中文| 久久精品二区亚洲w码| 日韩精品视频一区二区三区| 国产伦精品一区二区三区千人斩| 色8久久久久| 麻豆一区二区三| 久久精品导航| 日本麻豆一区二区三区视频| 欧美aⅴ一区二区三区视频| 久久久精品五月天| 欧美一区精品| 一区在线免费观看| 麻豆一区二区三区| 国产午夜精品一区二区三区欧美| 国产精品永久| 男人的天堂亚洲一区| 精品丝袜在线| 蜜桃视频第一区免费观看| 高清av一区| 亚洲日本三级| 超级白嫩亚洲国产第一| 精品国产亚洲一区二区在线观看| 色爱综合av| 亚洲资源在线| 婷婷综合六月| 久久99久久人婷婷精品综合| 国产精品97| 亚洲天堂成人| 午夜性色一区二区三区免费视频| 久久激情五月激情| 亚洲va中文在线播放免费| 亚洲综合丁香| 91欧美极品| 精品美女在线视频| 爽好多水快深点欧美视频| 精品欧美日韩精品| 激情婷婷欧美| 久久中文字幕av一区二区不卡| 国产精品v一区二区三区| 国产激情在线播放| 高清在线一区| 香蕉成人av| 日本成人在线网站| 日韩免费精品| 亚洲精品国产嫩草在线观看| 日本少妇精品亚洲第一区| 亚洲成人日韩| 国产va免费精品观看精品视频|