Home >  > 百度近日收录页面数量统计代码

百度近日收录页面数量统计代码

11

如很多人一样,我也有时会使用一个使用很广泛的SEO工具,就是Chinaz的站长工具。其中基本上就用两三个功能,主要的就是HTTP状态查询和百度近日收录。

其中百度近日收录一直用它查询,因为有点觉得像是Chinaz那个工具里面独有的,其他地方似乎没怎么看到过。但昨天自己又想了想就想出来它是哪里来的数据了。

其实回想下也很简单,既然是百度收录量,那自然是来自百度官方数据,能得到百度官方数据的途径无非就那么几种。百度近日收录这个问题上,就发现数据是来自于百度的高级搜索的。如今的高级搜索链接比较隐蔽,处于SERP的底部。其中就能限定时间来查询,那么只要用site命令加上限定时间就行了,剩下的只需要观察不同命令的查询url不同在哪里。

废话不多说了,给出代码:

HTML:
[sourcecode language="html"]
<html>
<head>
<title>百度近日收录查询</title>
</head>
<body>
<form action="tool.php" method="get">
<input type="text" name="url" />
<select name="date">
<option value="1">最近一天</option>
<option value="7">最近一周</option>
<option value="30">最近一月</option>
<option value="360">最近一年</option>
<input type="submit" />
</form>
</body>
</html>
[/sourcecode]

PHP:
[sourcecode language="php"]
<html>
<?php
$url = $_GET['url'];
$date = $_GET['date'];
site_date($url,$date);
function site_date($url,$date) {
$command = "http://www.baidu.com/s?q1=site:" . $url . "&q2=&q3=&q4=&rn=10&lm=" . $date . "&ct=0&ft=&q5=&q6=&tn=baiduadv";
$page = file_get_contents($command);

$postion = strpos($page,'<a href="#" onClick="h(this)">');
$temp_page = substr($page,$postion+77);

$postion = strpos($temp_page,'篇');
$result = substr($temp_page,0,$postion);

switch($date) {
case 1 :
$date_output = "天";
break;
case 7 :
$date_output = "周";
break;
case 30 :
$date_output = "月";
break;
case 360 :
$date_output = "年";
break;
}
echo "百度在最近的一" . $date_output . "内,共收录" . $url . '的<font color="red"> ' . $result . " </font>个页面(粗略数值,仅供参考)";
}
?>
</html>
[/sourcecode]

有两个问题:

1.得到收录数字的那块地方似乎照理说是应该用正则表达式提取的,但是正则不怎么会写,于是用了比较傻的方法。。。

2.由于以前学过的编程语言(C,Java),本来就学的很浅,又很久不碰了,几乎完全忘光。不然打算是做个命令行程序出来的,作为骨灰级的SEO工作效率提升工具。这个PHP版本单单这样看来价值不大,只是可能比Chinaz的用的稍微顺手一点,因为总觉得它的输入框输入起来很不方便,也不知怎么弄出来的问题。

总之是自己第一个用PHP写的比较完整的程序,这个也可以算是练习目的为主,下次做些更实用的东西出来。

相关推荐

关注科技,热血而沉着,极致而纯粹。努力做一个理想主义者。

Comment (11)
Trackback (0)
  1. 团购导航 unknowunknow 沙发 2011/01/14 05:36

    谢谢楼主分享了~~~

  2. 环保垃圾桶 unknowunknow 板凳 2011/01/16 07:52

    有收获啊

  3. 骨科医院 unknowunknow 地板 2011/01/17 05:49

    Chinaz的站长工具不错,很好。

  4. Carriage Bolts unknowunknow 4楼 2011/01/19 05:39

    我只管用,不管研究….

  5. 苏州广告公司 unknowunknow 5楼 2011/01/19 08:15

    学习了!!

  6. 站长工具 unknowunknow 6楼 2011/01/19 18:43

    博主的文章很不错,我是站长工具-站长精灵的作者,一款专业的SEO工具软件(可以帮您提高博客的流量),想跟您交换个链接,不知可否

  7. 万网主机 unknowunknow 7楼 2011/01/21 02:50

    好博文,支持分享

  8. 哈尔滨不孕不育医院 unknowunknow 8楼 2011/01/21 05:54

    支持博主,关注您很久了,小弟想和您换友情链接,不知道可不可以呢,http://www.bywhrb.com 如果可以的话 我的qq:1185750219 等您的好消息。^^

  9. 合肥seo unknowunknow 9楼 2011/02/23 03:16

    你的网站换链接吗 没有看到你的网站又友情链接哦

  • 还没有Trackback

发表评论

*

*