搞了半天,终于搞定了。
由于空间PHP版本的问题,没有办法使用SQLITE
本机很快就已经搭建完成。
数据也很快导入了。
但是发布出现两个问题
1、当部署到服务器的时候,安装插件的时候,发现TAG不正常显示,直接搜索插件也提示出现未知错误。原本是把自己本机弄好的直接上传,因此重新弄了一次。重新进行干净安装。但是奇怪的是,问题还是存在,然后在网吧又是正常的。
由于服务器速度问题,数据导入倒出问题,导致折腾了好几天。
2、数据错位问题,也许由于垃圾留言的影响,导致丢了几个BLOG,结果导入的时候没有发现,直接忽略空白内容,导致错位,标题和内容失配,只好又重新来过,这次在网吧折腾,好像速度会快些。
主题采用的是:Contrast Style 1.1 三栏,因为比较喜欢堆彻东西。
插件用了不少
Antispam Bee 屏蔽垃圾留言的
Akismet 自带反垃圾留言的,但是不知道到哪里去找被它砍掉的留言(上线才半天,报告干掉了24个)
Disable Canonical URL Redirection WP默认首页为不带index.php
Genki Announcement 公告栏
Peter’s Custom Anti-Spam 增加留言验证码
Simple Tags 智能标签,这个比较强大
Some Chinese Please 屏蔽纯洋文留言,上次就被阿拉伯文搞死两个BLOG
Wordpress Thread Comment 嵌套留言
WP-PageNavi 页码导航 但是不能输入
WP-PostViews BLOG点击数
WP-T-Wap WAP插件
WP Kit CN 强大
用来解决官方 WordPress 没有照顾到的中文相关问题。使用这个插件,你可以显示随机文章,最新留言(最新引用),留言最多文章,发表评论最多的网友,还有真正的文章摘要,等等,真正截断,没有乱码。此插件在桑葚基础上修改,支持最新评论显示表情。支持指定最新评论截断字数。使用了对中文兼容更好的截断算法,现在控制字数更精确了。
Genki AnnouncementSCP SettingPageNaviPostViewsWP-T-WAPSimple TagsWP Kit CN
标签:blog, com, http, log, org, page, php, post, sql, sqlite, thread, url, wap, word, wordpress, 上传, 中文, 乱码, 修改, 发布, 安装, 屏蔽, 插件, 搜索, 数据, 服务, 服务器, 比较, 版本, 结果, 部署, 错误, 问题windowsXP操作系统中点击搜索文件时时提示:搜索助理 意外错误 操作无法完成,请问如何解决?
当您在 Windows XP 中搜索文件和文件夹(单击“开始”,然后单击“搜索”)时,可能会看到 Search Companion 弹出式窗口,其中显示一个内含感叹号的黄色三角形。
出现此问题的原因可能在于,在以下位置缺少“搜索结果”文件夹的注册表项:
HKEY_LOCAL_MACHINE\\SOFTWARE\\Microsoft\\Windows\\CurrentVersion\\Explorer\\Desktop\\NameSpace
1. 单击“开始”,单击“运行”,键入 regedit,然后单击“确定”。
2. 在注册表中找到然后单击下面的项:
HKEY_LOCAL_MACHINE\\SOFTWARE\\Microsoft\\Windows\\CurrentVersion\\Explorer\\Desktop\\NameSpace
3. 在“编辑”菜单上,指向“新建”,然后单击“项”。
4. 键入 &leftsign;e17d4fc0-5564-11d1-83f2-00a0c90dc849&rightsign;,然后按 Enter 键。
5. 在右窗格中单击 (Default) 值。
6. 在“编辑”菜单上,单击“修改”。
7. 键入 Search Results Folder,然后单击“确定”。
使用XP搜索助理 ,提示"意外错误:操作无法完成"怎么办?_百度知道
http://zhidao.baidu.com/question/52530221.html
使用XP搜索,提示"意外错误:操作无法完成"_百度知道
http://zhidao.baidu.com/question/52530166.html
搜索助理 『一个困扰我好几天的问题』期待解决~ 操作系统 PChome社区
http://club.pchome.net/topic_5_63_71916_1__.html
windowsXP(SP2版)开始项中的"搜索"中的搜索助理显示为空白是怎么回事?_百度知道
http://zhidao.baidu.com/question/11582267.html?fr=qrl&fr2=query
windowsXP操作系统中点击搜索文件时时提示:搜索助理 意外错误 操作无法完成,请问如何解决?_百度知道
http://zhidao.baidu.com/question/6238102.html
我减肥了xp搜索助理,不能搜索了,说缺少文件,需要安装_百度知道
http://zhidao.baidu.com/question/4870405.html?fr=qrl&fr2=query
XP搜索助理点击"搜索"后,没有反应,再点,则标题栏出现"无响应"_百度知道
http://zhidao.baidu.com/question/13696817.html?fr=qrl&fr2=query
XP系统无法搜索文件_百度知道
http://zhidao.baidu.com/question/60177270.html?fr=qrl&fr2=query
windows xp搜索不能用了如何解决_百度知道
http://zhidao.baidu.com/question/26926817.html?fr=qrl&fr2=query
20070928 desktop search 桌面搜索引擎
http://www.yippeesoft.com
百度硬盘搜索
Google Desktop Search
MSN Toolbar
Yahoo! Desktop Search
桌面搜索引擎
桌面搜索是2004年搜索引擎领域的热门词汇之一,已经成为主要搜索引擎新的竞争领域。
2004年10月份,主流搜索引擎google率先推出桌面搜索工具,紧接着MSN也推出了同类产品,雅虎则在2005年1月11日发布了自己的桌面搜索工具。其实,早在2004年3月份Lycos/Hotbot发布了一款桌面搜索工具–HotBot Desktop,但由于其影响力有限,直到google桌面搜索推出之后才受到业内的广泛重视。国内的中搜则于2004年2月发布了全球第一款搜索桌面软件—网络猪,并于2004年12月下旬初发布了3.0版本
与一般基于浏览器地址栏的搜索方式不同,桌面搜索的特点在于不需要通过浏览器来进行搜索,并且将搜索方位延伸到自己电脑硬盘中所存储的各种文档,例如雅虎的桌面搜索引擎所支持文档格式包括的Email、Word、Excel、PowerPoint、PDF等等多达200多种格式的文本、音乐、图片和网页。该软件允许用户根据自己的风格控制搜索习惯,并且在用户的隐私方面也有独到的保护措施。
尽管目前在技术和应用方面还存在一定的问题,但桌面搜索已经成为一个被普遍看好的热门市场,因为服务商相信桌面搜索比传统的基于浏览器的搜索引擎有助于增加消费者的忠诚度,并为发布个性化广告奠定基础——在这方面,可能有点类似于即使信息的广告形式,这也是各种网络服务工具相互影响、相互吸收优点的发展所致。
http://disk.baidu.com/
百度硬盘搜索可以帮你快速找到电脑中的信息;更帮让你轻松管理硬盘!
目前支持以下类型的文件:
Outlook 电子邮件 WPS文档 JPG、GIF、BMP、TIF、PNG
Outlook Express 电子邮件 Word MP3、WAV、WMA
MSN 聊天记录 Excel AVI、MPG、WMV、RM等
本地网页和IE、Firefox网页历史 PowerPoint TXT、RTF,C、JSP等源代码
单独存放的电子邮件(.EML) PDF RAR、ZIP、EXE
此外,您还可以使用百度硬盘搜索插件,搜索更多文件类型。
http://www.microsoft.com/china/windows/wds/default.mspx
Windows 桌面搜索 (WDS) 可帮助您查找计算机上的任何内容 - 电子邮件消息、日历约会、照片、文档等等。对计算机进行搜索如同搜索网页一样轻松快捷。
•
快速查找信息 - Windows 桌面搜索帮助您在数秒钟内,从位于您的 PC 上的成千上万的文档和电子邮件中找出您需要的信息,从而提高您的效率。
•
从熟悉的界面进行搜索 - 可与 Microsoft Windows 和 Microsoft Office Outlook 无缝协同运作,为您提供熟悉、方便、轻松的使用体验。
•
轻松部署和管理 - 允许 IT 管理人员在企业内部快速部署、管理和推广。
Windows 桌面搜索 (WDS) 是一种技术,最终用户可借助该应用程序轻松地搜索其计算机硬盘和电子邮件消息中的内容。鉴于它可以帮助个人用户和企业员工轻松快速地找到他们所需要的信息,因而可以大大提高他们的工作效率。当今的社会是一个信息化的社会,我们每天都要处理不计其数的电子邮件、文件和文档。据 IDC 在 2003 年的一份研究指出,每人每年平均产出多于 800MB 的存储内容,而这个数字还在逐年增长。1 IDC 的另一份研究2 则指出信息工作者:
•
每周要花上 9.5 个小时(或每个工作日的四分之一时间)用于搜索信息,其估计成本为每个员工每年 $14,000
•
每周都有 3.5 个小时花费在搜索其所需的信息上,而最终却一无所获,其估计成本为每个员工每年 $5,000
•
每周都要花上 3 个小时来重新创建内容,其估计成本为每个员工每年 $4,500
1IDC 报告:来源,IDC,“企业工作环境如何改变我们的工作方式”,文档编号:32919,2005 年 2 月。
2IDC 报告:IDC 白皮书,提供者:Microsoft,标题:“信息工作的隐藏成本”,2005 年 3 月。
有了 WDS,您只用一个简单的搜索就可以尽情地查找您计算机中的任何内容:电子邮件消息、日历约会、照片、文档等等,就如同您搜索网页一样简单。WDS 的主要入口点在 Windows 桌面工具栏上 - 这是 Windows 任务栏中的一个搜索框。Windows 桌面工具栏允许您快速搜索桌面;启动网页搜索或 Intranet 搜索。伴随着强大的 "search as you type"(即搜即得)功能,您瞬间便可看到搜索结果,而且只需轻轻地单击一下,就可以得到您所查找的信息。您还可以通过添加到“开始”菜单中的快捷方式来启动 WDS。
借助 WDS,您可以搜索最常见的几种文档文件类型的内容,其中包括文本文件、Word 文档、Excel 电子表格、照片、视频、音乐等等。此外,该产品是完全可扩展的,因此您可以选择安装各种插件,例如 Adobe 插件 iFilter,它还允许您搜索 PDF 文档的内容。在MSDN 中记载了各种 iFilter,任何开发人员都可以针对专用文件类型或文档类型编写 iFilter。
此外,WDS 还可以搜索音乐、图像、视频文件以及可执行程序文件标题中的元数据信息。
您还可以搜索所有 Microsoft Office Outlook 和 Microsoft Outlook Express 项中的内容。
对于企业 IT 环境,Windows 桌面搜索可使用户充分体验到 WDS 在其工作环境中的丰富功能,同时还遵守内部 IT 管理员的安全和策略要求。
Windows Desktop Search 是在计算机上启用立即搜索的技术。它帮助您查找、预览,并使用你的文档、电子邮件、音乐、照片和其它项目。 Windows Desktop Search 3.0 中的搜索引擎是一个 Windows 服务程序,可由 Microsoft Office Outlook 2007 和 OneNote 2007 等应用程序使用,以在那个应用范围内进行搜索时检索出应用内容并提供即时结果。 Windows Desktop Search 提供快速检索功能、改进的性能和改进的文件类型支持。如果您选择安装和使用 Windows Desktop Search,则可以搜索您计算机上的电子邮件、文档和其它文件。您计算机上的有关文件信息将不会作为这个过程的一部分发送给 Microsoft。 相反,Windows Desktop Search 将检索您计算机上的内容,并且把索引文件存储在您的计算机上。 您可以自定义 Windows Desktop Search,以只检索计算机上的指定文件夹。 在删除电子邮件或文档之后,Windows Desktop Search 将不会为它们存储一份副本。在你安装本更新程序后,可能需要重新启动计算机。
http://desktop.google.com/zh/gettingstarted.html
简介:Google 桌面的工作原理
您的计算机中拥有大量信息。如果总能在需要时找到,是不是很不错?您可使用 Google 桌面查找文件、电子邮件、IM 聊天记录以及曾经浏览过的网页。带有补充工具栏的 Google 小工具可将最新信息(电子邮件、照片、天气、新闻报道等)展示在您的桌面上。
当您浏览网页、阅读电子邮件或编辑文件时,Google 桌面会为相应项目编制索引 , 并将其内容复制到您的本地缓存中,因此,您可以查找文件和网页的旧版本等。
多个文件类型
Google 桌面会就您计算机上的下列项目类型自动编制索引,并允许您对其进行全文搜索:
* Gmail
* Outlook Outlook Express
* Word
* Excel
* PowerPoint
* Internet Explorer
* AOL Instant Messenger
* MSN Messenger
* Google Talk
* Netscape Mail/Thunderbird
* Netscape/Firefox/Mozilla
* PDF
* 音乐
* 视频
* 图片
* Zip 文件
http://us.config.toolbar.yahoo.com/yds
标签:des, desktop, search, 搜索, 搜索引擎
20070724 FIREFOX ADDON Super DragAndGo
http://www.yippeesoft.com
Super DragAndGo 不能拖放文本搜索
drag de drop有个弱智的地方,拖放文本搜索后,再拖放一个链接,结果仍然打开搜索页搜索选择的文本~
Super DragAndGo 0.2.6 使用不正常, 拖动选中的文字无法使用搜索引擎进行搜索,拖到搜索框才行。我用的2.0beta2
我也发帖问了这个问题, 但是回帖的说他们没问题, 我还以为是我自己的原因呢。。
后来去老外网站查才知道super drag and go 和 2.0不兼容, 不过装个老外的改造版就好了。
时间: 2006-10-14 周六, 15:06 标题: 引用回复
幸好留了个备份, 需要的拿去吧。 Very Happy
SuperDragAndGo-0.2.6.1.rar
描述:
SuperDragAndGo-0.2.6.1
keyword.URL = http://cn.search.yahoo.com/search?ei=UTF-8&p=
似乎就是地址栏输入关键字时用来搜索的链接~~~呵呵,我把它改为
keyword.URL = http://www.baidu.com/s?ie=UTF-8&wd=
呵呵,成功了~~~
再看看第一,第二行
browser.search.defaultenginename = Yahoo
browser.search.order.1 = Yahoo
这一行所指定的搜索引擎是你在网页中选择文字后,右键菜单中出现的 “通过 XX 搜索 XX”的默认搜索引擎,我把它改成了:
browser.search.defaultenginename = Baidu
browser.search.order.1 = Baidu
下载
http://www.firefox.net.cn/newforum/viewtopic.php?t=16406
扩展备份: (34 全部) – 显示用户已关闭的扩展插件。
1. AdblockFilterset.GUpdater&leftsign;0.3.1.0&rightsign;
2. AdblockPlusElementHidingHelper&leftsign;1.0.1&rightsign;
3. AdblockPlus&leftsign;0.5.11.4&rightsign;
4. AdblockPlus&leftsign;0.7.5.1&rightsign;
5. BookmarkBackup&leftsign;0.4.2&rightsign;
6. BookmarksLinkChecker&leftsign;0.6.8.4&rightsign;
7. ContextSearch&leftsign;0.4.1&rightsign;
8. DownThemAll&leftsign;0.9.9.10&rightsign;
9. DownloadEmbedded&leftsign;0.5&rightsign;
10. DownloadStatusbar&leftsign;0.9.5&rightsign;
11. DragdeGo&leftsign;0.2.5&rightsign;
12. FEBE&leftsign;5.0&rightsign;
13. Fasterfox&leftsign;2.0.0&rightsign;
14. FireFTP&leftsign;0.97&rightsign;
15. IETab&leftsign;1.3.3.20070528&rightsign;
16. LinkChecker&leftsign;0.6.1&rightsign;
17. ListZilla&leftsign;0.8&rightsign;
18. McAfeeSiteAdvisor&leftsign;26.3&rightsign;
19. MediaWrap&leftsign;0.1.6.3&rightsign;
20. MinimizeToTray&leftsign;0.0.1.2006102615+&rightsign;
21. NoScript&leftsign;1.1.6.06&rightsign;
22. PageTitleEraser&leftsign;0.6.3&rightsign;
23. SearchStatus&leftsign;1.20&rightsign;
24. Stylish&leftsign;0.5.2&rightsign;
25. SuperDragAndGo&leftsign;0.2.6.1&rightsign;
26. TabMixLiteCE&leftsign;2.0.1&rightsign;
27. TabMixPlus&leftsign;0.3.6&rightsign;
28. TimeTracker&leftsign;1.2.2&rightsign;
29. TinyMenu&leftsign;1.4.4&rightsign;
30. TitlebarTweaks&leftsign;1.8.0&rightsign;
31. URLSuffix&leftsign;0.3.6&rightsign;
32. dotCOMplete&leftsign;1.4.2&rightsign;
33. gladder&leftsign;1.2.0.2&rightsign;
34. wmlbrowser&leftsign;0.7.13&rightsign;
~~~~~~
陈明杰:傲游可能推FireFox内核浏览器
nings发布于 2007-07-25 12:42:01&line; 次阅读 字体:大 小 打印预览
Maxthon 傲游
7 月24日,傲游浏览器创始人陈明杰做客新浪科技白银时代访谈时表示,虽然傲游目前是基于微软IE浏览器的内核开发,但将来也可能转向Firefox内核,关键是要看哪个内核能实现更好的功能。目前拥有自己内核浏览器主要包括的IE、Firefox、Opera三种,陈明杰称傲游只是“小兄弟”,不会介入内核阵营之间的政治争斗。虽然目前傲游和微软关系比较密切,但傲游与Firefox也有良好的沟通,不排除将来推出基于Firefox内核的傲游浏览器。
陈明杰认为,傲游与微软IE有竞争,但也有互补的关系。IE这种有内核的浏览器其实是在做基础设施,傲游在此基础设施上做应用开发,将来仍然有很好的发展空间。
傲游是国内流行的多页面浏览器软件,其用户已经超过1亿,就陈杰明表示,据傲游统计,每天使用傲游的用户超过1000万。对于此前Google将投资傲游的传闻,陈明杰表示,“傲游欢迎从业务到资本各个层面的合作”。
Gecko内核的浏览器主要分两类,一类是以Mozilla Firefox为代表的,用XUL作为界面描述语言的浏览器:
这年头,说不定过一年出现基于MT内核的浏览器呢
标签:addon, and, fire, firefox, 搜索20070712 搜索引擎 蜘蛛 捕捉
http://www.yippeesoft.com
网上下载的一个PHP捕捉,修改了保存路径和搜索引擎蜘蛛类别判断
<?php
/**
* @author Tmpbin (tmpbin@163.com)
* @copyright Www.Ruanzai.Net
* @package ccount.php
* @version 1.0
* @lastupdate 2006-12-10
* @link http://www.ruanzai.net
*/
$datadir=$_SERVER[SCRIPT_FILENAME];
//日志所在目录,请用绝对路径如 d:/host/web/log/
$len=strlen($path)-9;
$datadir=substr($path,0,$len);
session_start();
$datafile=$datadir."system_bot.php";
$lang = $_SERVER[\'HTTP_ACCEPT_LANGUAGE\'];
$urlhead .= "Accept-Encoding: ".$_SERVER[\'HTTP_ACCEPT_ENCODING\']."&line;";
$urlhead .= "User-Agent: ".$_SERVER[\'HTTP_USER_AGENT\']."&line;";
$urlhead .= "Host: ".$_SERVER[\'HTTP_HOST\']."&line;";
$cookie = $_SERVER[\'HTTP_COOKIE\'];
$time=time();
$userip = $_SERVER["HTTP_X_FORWARDED_FOR"];
If ($userip == "") $userip = $_SERVER["REMOTE_ADDR"];
$urlPar = $_SERVER["SCRIPT_NAME"];
if (trim($_SERVER["QUERY_STRING"]) != "")
$urlPar = $urlPar."?".$_SERVER["QUERY_STRING"];
$info_cot=$time."&line;".$userip."&line;".$urlPar."&line;".$urlhead."\\n";
if (empty($cookie)) &leftsign;
if (empty($lang))&leftsign;
$fnum=@fopen("$datafile","a");
flock($fnum,LOCK_EX);
$file_data=fwrite($fnum,$info_cot);
fclose($fnum);
&rightsign;
&rightsign;
?>
function get_naps_bot($iee)
&leftsign;
$useragent = strtolower($iee);
if (strpos($useragent, \’googlebot\’) !== false)&leftsign;
return \’Googlebot\’;
&rightsign;
if (strpos($useragent, \’msnbot\’) !== false)&leftsign;
return \’MSNbot\’;
&rightsign;
if (strpos($useragent, \’slurp\’) !== false)&leftsign;
return \’Yahoobot\’;
&rightsign;
if (strpos($useragent, \’baiduspider\’) !== false)&leftsign;
return \’Baiduspider\’;
&rightsign;
if (strpos($useragent, \’sohu-search\’) !== false)&leftsign;
return \’Sohubot\’;
&rightsign;
if (strpos($useragent, \’lycos\’) !== false)&leftsign;
return \’Lycos\’;
&rightsign;
if (strpos($useragent, \’robozilla\’) !== false)&leftsign;
return \’Robozilla\’;
&rightsign;
return $iee;
&rightsign;
$thisprog="log.php";
$_SESSION[\'login\']="ok";
if ($job=="") &leftsign;
$a=2;
$str=file("$datafile");
$count = count($str);
for ($i=0;$i<$count;$i++)&leftsign;
$file.= $str[$i];
&rightsign;
$new_info=explode("\\n",$file);
$count=count($new_info);
for ($i=0; $i<$count-1; $i++) &leftsign;
list($time,$ip,$url,$ae,$ie,$host)=explode("&line;","$new_info[$i]");
$time=date("Y-m-d(H:i:s)",$time);;
$ie=get_naps_bot($ie);
#$iet=get_naps_bot($ie);
$show=$show."<tr class=\’row$a\’><td width=10%>$time</td><td width=5%>$ip
</td><td width=20%>$url</td><td width=30% title=\\"$iet\\">$ie</td><td width=5%>$ae</td><td width=20%>$host</td></tr>\\n";
$a=$a-1;
if ($a<1) $a=2;
&rightsign;
print <<<EOT
<table width=98% align=center cellSpacing=1 cellPadding=1 style="border-collapse: collapse;background: #E5ECFA; border: 1px solid #5296FF ">
<tr align=\’center\’>共$count 条日志
<td style="color: #000000"><b>机器人到访日志查看</b></td>
</tr>
<tr>
<td>
<table width=99% align=center cellSpacing=1 cellPadding=1 style="border-collapse: collapse;background: #E5ECFA; border: 1px solid #5296FF ">
<tr class=\’rowcat\’>
<td width=10%> 到访时间
</td><td width=5%>蜘蛛Ip
</td><td width=20%>访问地址
</td><td width=30%>蜘蛛信息
</td><td width=5%>Accept-Encoding
</td><td width=20%>主机
</td></tr>
$show
标签:blog, log, 搜索, 搜索引擎, 蜘蛛
20070712 搜索引擎 蜘蛛 灭害
http://www.yippeesoft.com
加上一个蜘蛛统计的PHP ,发现。。。。。。
菩提:喝茶。
至尊宝:麻烦你了!
菩提:不要客气!
至尊宝:为什么带我回这个洞呢?
菩提:不是我们带你来的,是你昏倒迷迷糊糊带我们来的!
至尊宝:我一定是太想念晶晶了。
菩提:是啊,你昏倒的时候叫了晶晶这个名字叫了九十八次。
至尊宝:晶晶是我娘子。
菩提:还有一个名字叫紫霞的你叫了七百八十四次!
至尊宝:啊?!
菩提:七百八十四次……这个紫霞一定欠你很多钱。
我问候了YAHOO N次后,发现我还要问候×× ×× N次
因为,他们一定欠我很多流量
刚才看访问记录看到有Yahoo! Slurp,msnbot/1.0,Baiduspider+,Mediapartners-Google/2.1,lanshanbot/1.0+
YAHOO的抓了我1451 次,这个lanshanbot抓了 1219 次。。
今天查看网站访问日志的时候发现了一个陌生的蜘蛛,lanshanbot/1.0 202.96.51.146,google/baidu搜索都查不到相关的结果,google里只找到了一条 Details of "lanshanbot/1.0" user-agent ,也没提到这蜘蛛是谁家的,俺只好自己来探一探了。
先到ip138查询202.96.51.146这个IP,结果为:
查询结果1:北京市 电信
查询结果2:北京市 东方网景
这个东方网景是谁?google查询,好象应该是east.net。上east.net去看一看,好象是一个搞网站建设之类的公司,靠!
估计是什么人的主机托管在那里,然后由这个主机放蜘蛛出来搜索资料的。至于搜索得到的资料干什么用去了,嘿嘿,不好说
The Alexa crawler (robot), which identifies itself as ia_archiver in the HTTP "User-agent" header field, uses a web-wide crawl strategy. Basically, it starts with a list of known URLs from across the entire Internet, then it fetches all local links found as it goes. There are several advantages to this approach, most importantly that it creates the least possible disruption to the sites being crawled.
Alexa启用了一个叫做IA_Archiver的机器人程序,这个机器人程序类似Google等搜索引擎使用的蜘蛛程序,专门在互联网上爬行,刺探每个Web页面的流量信息。尤其是当某个网站的流量超过Alexa设定的阈值时,IA_Archiver就会马上爬到该网站的服务器上,分析此网站的流量是否正常,有没有作弊行为
加上
User-agent: Baiduspider+
Disallow: /
User-agent: Baiduspider
Disallow: /
User-agent: ia_archiver
Disallow: /
User-agent: lanshanbot
Disallow: /
SetEnvIfNoCase User-Agent "^Baiduspider" ban_bot
SetEnvIfNoCase User-Agent "^Baiduspider+" ban_bot
SetEnvIfNoCase User-Agent "^ia_archiver" ban_bot
SetEnvIfNoCase User-Agent "^lanshanbot" ban_bot
deny from env=ban_bot
哇噻:
悟空:大家看到啦?这个家伙没事就长篇大论婆婆妈妈叽叽歪歪,就好象整天有一只苍蝇,嗡……对不起,不是一只,是一堆苍蝇围着你,嗡…嗡…嗡…嗡…飞到你的耳朵里面,救命啊!
(悟空倒地翻滚,异常痛苦。)悟空:所以呢我就抓住苍蝇挤破它的肚皮把它的肠子扯出来再用它的肠子勒住他的脖子用力一拉,呵--!整条舌头都伸出来啦!我再手起刀落哗--!整个世界清净了。现在大家明白,为什么我要杀他!
标签:搜索, 搜索引擎, 蜘蛛20070614 microsoft.com baidu google
看到说MCIROSOFT.COM开始使用 WINDOWS 2008作为服务器操作系统
顺手右键一拖,结果进入搜索 看到如下
出来的是 罗定市智高网络科技有限公司?!
GOOGLE今天也抽筋
我还是用的GOOGLE.CN
| Error | |
Server Error
The server encountered a temporary error and could not complete your request.
Please try again in 30 seconds.
罗定市智高网络科技有限公司…
microsoft.com/ 1K 2007-6-12 – 百度快照
·如果您在寻找正文中包含“Microsoft.com”的所有网页,请点击这里
实在佩服那个公司,再搜索
第一页正常:
罗定市智高网络科技有限公司
广东省罗定市智高网络科技有限公司长期以来,秉承“以人为本,服务社会”的宗旨,以市场为导向,以技术为核心,以服务为…-智高网络科技有限公司,是罗定市领先的互联网技术公司,在开发互联网应用、服务及其它技术方面,我公司始终保持罗定…
www.ldpc120.com/Aboutus.asp?Title=成长历程 20K 2007-5-23 – 百度快照
www.ldpc120.com 上的更多结果
第二页:
罗定市智高网络科技有限公司…
microsoft.com/ 1K 2007-6-13 – 百度快照
不知道这公司怎么弄的
GOOGLE.CN
| Microsoft. Microsoft.com MSN Web Search. 产品家族. Windows · Office · Servers · 开发工具 · 商务管理解决方案 · 硬件产品 · MSN … Microsoft.com 全球站点. 国家和地区. 正版授权, “2007 Windows 硬件工程大会”及“2007 移动与嵌入 … www.microsoft.com/china/ – 2007年6月13日 – |

ImageShack是个图片上传,提供外部引用网站。支持的图片格式有:jpeg; jpg; png; gif; bmp; tip; tiff; swf 等,图片最大大小是1024KB。
点击图片看大图
这是网站的首页,简单明了,点浏览找到图片再点 “host it!”,就上传了。图片上传后,网站会自动给出多种链接代码,如论坛的,网页的,有全尺寸的,也有缩略图的,等待。如下图示:
在ImageShack上传图片并不需要注册,如果注册了,就可以相当拥有自已的一个相册,以后点My Images就可以看到自已上传的图片集。
列有每个图片的缩略图及链接代码等。
ImageShack上一开始,偶找不到注册的地方,后来才发现就是点My Images后,它就会提示输入一个信箱地址,然后它就自动发封信到你邮箱,里面有个链接,这个链接就是进入自已相册的链接,并不采用密码这些东西。链接上有一长串的识别码。
标签:baidu, com, google, microsoft, 搜索20070307 搜狗网页搜索3.0
有几个问题
数据分析表明,用户每次搜索后,点击结果的次数越多,说明搜索结果越精准。
这个我觉得如果答案正确的话,应该只是点击一次吧
搜狗在搜索结果的排名上采用了被业界广泛认可的搜狗网页评级体系。
可是一月一日才上线不是?? 怎么广泛认可呢?
而一个显示圆周率的网站,可能三年都不会更新一次。
可能每天多算一位?
到比比看比较了一下
<h2 class="title5">您的选择</h2>
<dl class="rank">
<dt class="rank1">搜狗最好</dt>
<dd class="bar1"><img src="/images/bbk/bar1.gif" alt="0" height="31" width="0"></dd>
<dd class="point">0次</dd>
</dl>
<dl class="rank">
<dt class="rank2">百度最好</dt>
<dd class="bar2"><img src="/images/bbk/bar2.gif" alt="0" height="31" width="0"></dd>
<dd class="point rank2">0次</dd>
</dl>
<dl class="rank">
<dt class="rank3">谷歌最好</dt>
<dd class="bar3"><img src="/images/bbk/bar3.gif" alt="4" height="31" width="230"></dd>
<dd class="point rank3">4次</dd>
</dl>
</div>
为了解决广大中文网民面对的数据量大、更新慢、结果不精准这三大问题,搜狗将于2007年1月1日推出网页搜索3.0的版本。该版本的特点是:海量全、及时新、精准。
2.1. 海量全——收录百亿网页
历史上,搜狗就一直重视数据量的积累。但是由于搜狗起步较晚,因此在2004年的8月发布的时候,数据量实际上非常小,大概只有有2亿,以致当时刚刚用搜狗搜索引擎的用户普遍反映在搜狗上有很多内容查不出来。但是,一直致力于后台技术研发和数据积累的搜狗,只用了两年时间,在2006年8月份的时候,就成功支持了50亿中文网页的查询,成为了全球首个中文网页收录量达到50亿的搜索引擎。
我们知道,每一次数据量的大幅提升,都需要后台技术对于抓取、页面分析、滤重、索引、排序、反垃圾等一系列的功能模块进行全方位的升级,以支持更大的容量;因此,数据量的大小,从一定程度上反映了搜索引擎研发团队的技术实力。在2007年1月1日搜狗3.0发布的时候,搜狗更是将数据量拓展到了 100亿,自主研发的超流水线并行抓取技术自主研发的并行协同抓取技术,进一步拉开了与竞争对手的差距。值得一提的是,由于采用了自行开发的文件系统和数据库,搜狗大幅提升了服务器利用率,用远少于竞争对手的投入,就达到了收录百亿网页目标。
搜狗对于数据量的积累,实际上是按照指数级的速度在增长的。而大家对互联网的一个普遍认识:中文互联网的网页数量也是按照指数级的方式在增长的。因此可以非常有信心地说搜狗的增长是能够跟上中文互联速度增长或者说爆炸速度的。
2.2. 及时新——每天更新五亿网页
我们知道,互联网上不同网页之间的更新速度差异是巨大的。比如新闻网站,每天都会有大量新内容的产生;而一个显示圆周率的网站,可能三年都不会更新一次。因此,在抓取速度上,搜狗通过智能分析技术,对于不同网站、网页采取了差异化的抓取策略,充分地利用了带宽资源来抓取高时效性信息,确保互联网上的最新资讯能够在第一时间被用户检索到。
此外,依托于搜狐内容频道这一中国最领先的,覆盖了几乎所有国内外重要新闻的新媒体资讯平台,搜狗能直接获取到最新的高质量新闻内容,在很大程度上保证了搜狗对于及时性超快的响应,成为搜狗网页搜索独一无二的优势。
在网页搜索3.0平台上,每天搜狗的服务器集群并行更新超过五亿的网页。在强大的更新能力下,用户不必再到专门的新闻搜索引擎上,就能获得最新的资讯。
为了满足对及时性要求极高的用户的需求,搜狗还特意提供了按时间排序的功能,使得搜狗网页搜索3.0强大的网页更新能力,能够帮助用户更快地找到想要的信息。
2.3. 精准——评测指标业内领先
众所周知,Google较之于第一代搜索引擎(如Yahoo! Directory)在搜索结果的准确性上有大幅提高,很大程度上得益于它名为“Page Rank”的网页排名算法。在互联网上,如果一个网页被很多其它网页所链接,说明它受到普遍的承认和信赖,那么它的排名就应当高。这就是 Page Rank 的核心思想。但是,由于Google对于中文互联网的收录量不足,因此对于链接关系的考量不够全面,导致其中文搜索效果不如英文。
搜狗在搜索结果的排名上采用了被业界广泛认可的搜狗网页评级体系。网页评级是搜狗衡量网页重要性的指标,不仅考察了网页之间链接关系,同时考察了链接质量、链接之间的相关性等特性,是机器根据Sogou Rank算法自动计算出来的,值从0至100不等。网页评级越高,该网页在搜索中越容易被检索到。
搜狗网页评级依托搜狗百亿中文网页的储备,分析最全的中文互联网链接库,确保评级的客观公正。由于有了网页评级体系的保证,搜狗的搜索结果能够做到更加精准。
在学术界,网页搜索的查询被分为导航型和信息事务型两类。导航型是指用户输入“搜狐”、“搜狗”、“ChinaRen”等关键字的查询,他们预期在第一条结果得到准确的站点结果。信息事务型是指用户输入“绿茶”、“张靓颖”等关键字的查询,他们预期找到包含该关键字的各种网页,从中获取有用信息。经过人工对于随机选取的上千个查询词进行测试,搜狗在导航型和信息事务型查询的表现,分别达到了94%和67%的准确度,处于业内领先水平。
另外一方面,用户对于搜索结果的点击,代表了用户对搜索结果的认可。数据分析表明,用户每次搜索后,点击结果的次数越多,说明搜索结果越精准。搜狗从用户体验出发,将结果点击次数与搜索次数的比率,即点击通过率,作为评估搜索结果精准性的重要指标,进行优化,确保我们的算法满足用户对于“精准” 的理解。
3. 效果
通过搜狗网页搜索3.0在海量在全、及时新、精准三方面的努力,搜狗网页搜索的效果得到了大幅提升,有效解决了中文搜索用户面临的三大困扰。
在海量方面,由于数据量大,保证了有价值的信息能被找到。比如搜索“中国站长大会”,搜狗的结果相对于百度的结果,明显能看见数据量大所产生的优势。
在及时性方面,搜狗在多次互联网热点事件后,均在第一时间内搜索到了大量相关结果,满足了网友对于新信息的获取。经过测试,互联网上的热点新闻,搜狗3.0仅需1分钟时间就能完成从抓取到页面分析到建立索引到上线的全部过程。在这样的速度下,每天搜狗的服务器集群并行更新了上亿的网页。在强大的更新能力下,用户不必再到专门的新闻搜索引擎上,就能获得最新的资讯。
在精准方面,用户对于搜索结果的点击,代表了用户对搜索结果的认可。数据分析表明,用户每次搜索后,点击结果的次数越多,说明搜索结果越精准。搜狗从用户体验出发,将结果点击次数与搜索次数的比率,即点击通过率,作为评估搜索结果精准性的重要指标,进行优化,确保我们的算法满足用户对于“精准” 的理解。搜狗在3.0版本上线后,网页搜索的点击通过率提升了10%。从数据统计上,证明了网页搜索3.0的强大能力。
标签:搜索, 网页0409 疯了 搜索引擎疯狂TRACKBACK
由于布局关系,很少看到TRACKBACKS,今天不经意间看了一下TRACKBACK,差点晕倒,
居然多了很多,我把条数设置到50,居然还是看到了。
一直设置到了300条,终于看到了最早的那条:
看看信息
关于 B2SEE Becky!看图插件0.1.4.510 的trackback信息
此文发表于 2005年1月25日21:20星期二 , 目前有 3 条Trackbacks记录。
请选择与您blog的编码一致的引用地址(trackback地址)。
如采用 GB2312(国标中文简体) 编码请使用下列地址: http://www.yippeesoft.com/blog/tb.php?tb_id=1106659220&c=gb [点击复制]
如采用 Big5(中文繁体大五码) 编码请使用下列地址: http://www.yippeesoft.com/blog/tb.php?tb_id=1106659220&c=big5 [点击复制]
如采用 UTF-8(万国码) 编码请使用下列地址: http://www.yippeesoft.com/blog/tb.php?tb_id=1106659220 [点击复制]
编码选择错误,会产生接受信息乱码,管理员可能会随时删除乱码的引用内容!
返回
此文现有Trackback回应:
this is very good [2006年4月8日15:37] 来自 this is very good(删除)
摘要 related source
地址 http://www.google.com/
——————————————————————————–
this is very good [2006年4月8日15:29] 来自 this is very good(删除)
摘要 this is related article
地址 http://www.google.com/
——————————————————————————–
this is very good [2006年4月8日14:35] 来自 this is very good(删除)
摘要 good related article
地址 http://www.yahoo.com/
统计了一下,居然有200条。不知道TRACKBACK的原理是什么,应该留下的地址是原始地址
真是莫名其妙
最新引用
· related sour…
· 0409 DWORD_…
· good related…
· related sour…
· related sour…
· good related…
· this is rela…
· good related…
· this is rela…
· good related…
· this is rela…
· this is rela…
· good related…
· related sour…
· this is rela…
PHP MYSQL 分页 上一页 下一页 GO 搜索 3 今天发现一些问题: www.yippeesoft.com
1、如果搜索结果再 进行编辑,那么由于传递的只是ID,那么会导致编辑变成列表
修改:www.yippeesoft.com
增加一个参数传递
function edit()
&leftsign;
global $db,$id,$curid;
$this->Show($curid);
&rightsign;
增加一个判断 www.yippeesoft.com
if ($actname=="edit")
&leftsign;
$sqll="select * from companys where companyid =".$id;
&rightsign;
2、如果下一页再进行编辑,同样也会有问题
修改同上 www.yippeesoft.com
3、计算总数修改: www.yippeesoft.com
if ($this->GetCount()%$this->NumPerPage==0)
&leftsign;
$total=floor($this->GetCount()/$this->NumPerPage);
&rightsign;
else
$total=floor($this->GetCount()/$this->NumPerPage)+1;
结果又发现一个问题: www.yippeesoft.com
如果进行搜索后,此时的翻页链接就不正常了:
http://127.0.0.1/bill/admin/department.php?actname=next&curnumm=3
此时只有当前页面序号,无法传递查询参数。
想了想,估计应该这样修改 www.yippeesoft.com
页面增加一个显示所有的链接 www.yippeesoft.com
如果是搜索,那么计算总数的代码和链接生成代码都需要修改,要不就在链接中传递搜索参数,要不就在
session_start();
$_SESSION[\'favcolor\'] = \’green\’;
存储搜索变量,不过这样就比较罗嗦了。
有一个 Discuz! Board 论坛 www.yippeesoft.com
Crossday Discuz! Board(以下简称 Discuz!,中国国家版权局著作权登记号 2003SR6623)是一个通用的论坛软件系统,用户可以在不需要任何编程的基础上,通过简单的设置和安装,在互联网上搭建起具备完善功能、很强负载能力和可高度定制的论坛服务。Discuz! 的基础架构采用世界上最流行的 web 编程组合 PHP+MySQL/PgSQL 实现,是一个经过完善设计,适用于各种服务器环境的高效论坛系统解决方案。
从说明来看,应该比较厉害,他们的处理是这样的: www.yippeesoft.com
/dz/search.php?searchid=148&orderby=lastpost&ascdesc=desc&searchsubmit=yes&page=6
也是在链接中传递,不过传递的好像是排序项目、排序规则和是否提交搜索以及当前页面号
有一个SERCHID,好像每次都不一样,估计它是把查询条件放在了数据库或者什么地方
PHP MYSQL 分页 上一页 下一页 GO 搜索 www.yippeesoft.com
http://www.yippeesoft.com/blog/p/phpmysqlprenextgo.php
http://www.yippeesoft.com/blog/p/phpmysqlprenextgo2.php
Session 变量:$_SESSION www.yippeesoft.com
注: 在 PHP 4.1.0 及以后版本使用。之前的版本,使用 $HTTP_SESSION_VARS。
包含当前脚本中 session 变量的数组。参阅 Session 函数 文档以获得更多信息。
这是一个“superglobal”,或者可以描述为自动全局变量。这只不过意味这它在所有的脚本中都有效。在函数或方法中您不需要使用 global $_SESSION; 来访问它,就如同使用 $HTTP_SESSION_VARS 一样。
$HTTP_SESSION_VARS 包含着同样的信息,但是不是一个自动全局变量。
如果设置了 register_globals 指令,这些变量也在所有脚本中可用;也就是,分离了 $_SESSION 和 $HTTP_SESSION_VARS 数组。相关信息,请参阅安全的相关章节 使用 Register Globals。这些单独的全局变量不是自动全局变量。
标签:mysql, php, sql, 上一页, 下一页, 分页, 搜索PHP MYSQL 分页 上一页 下一页 GO 搜索 www.yippeesoft.com
function Show($cur=1) www.yippeesoft.com
&leftsign;
global $db,$id,$actname;
$total=floor($this->GetCount()/$this->NumPerPage)+1;
if ($cur>$total)
$cur=$total;
if ($cur<1) www.yippeesoft.com
$cur=1;
$sqll = "SELECT * FROM operators ";
if ($actname=="search") www.yippeesoft.com
&leftsign;
$namee=$_POST["namessearch"];
$sqll = "SELECT * FROM operators where loginname=\’".$namee."\’";
//echo $sqll;
&rightsign; www.yippeesoft.com
$sqll=$sqll." limit ".($cur-1)*$this->NumPerPage.",".$this->NumPerPage;
$oprst=$db->Exec($sqll);
echo $this->GetCount(),$this->NumPerPage,$total;
$curnum=$cur;
require "./admin.html";
&rightsign; www.yippeesoft.com
函数的参数 www.yippeesoft.com
通过参数列表可以传递信息到函数,该列表是以逗号作为分隔符的变量和常量列表。
PHP 支持按值传递参数(默认), 通过引用传递, 和 默认参数值. 可变长度参数列表仅在 PHP 4 和后续版本中支持;更多信息请参照 可变长度参数列表 和涉及到的相关函数 func_num_args(), func_get_arg(), 和 func_get_args()。 PHP 3 中通过传递一个数组参数可以达到类似的效果:
通过引用传递参数 www.yippeesoft.com
缺省情况下,函数参数通过值传递(因而即使在函数内部改变参数的值,它 并不会改变函数外部的值)。如果你希望允许函数修改它的参数值,你必须 通过引用传递参数。
如果想要函数的一个参数总是通过引用传递,你可以在函数定义中该参数的 前面预先加上符号(&):
默认参数的值 www.yippeesoft.com
函数可以定义 C++ 风格的标量参数默认值,如下:
默认值必须是常量表达式,不是(比如)变量,类成员,或者函数调用。
请注意当使用默认参数时,任何默认参数必须放在任何非默认参数的右侧;否则, 可能函数将不会按照预期的情况工作。考虑下面的代码片断:
可变长度参数列表 www.yippeesoft.com
PHP 4 已经在用户自定义函数中支持可变长度参数列表。这个真的很简单, 使用 func_num_args(),func_get_arg(),和 func_get_args() 函数.
无需特别的语法,参数列表仍然能够被明确无误的传递给函数并且正常运转。
PHP 不支持函数重载,可能也不支持取消定义或者重定义已声明的函数。
注: 函数名是非大小写敏感的,不过在调用函数的时候,通常使用其在定义时相同的形式。
PHP 3 虽然支持默认参数(更多的信息请参照 默认参数的值) ,但是却不支持可变的参数个数。 PHP 4 支持: 见 可变长度的参数列表 和涉及到的相关函数 func_num_args(), func_get_arg(), 和 func_get_args() 以获取更多的信息。
标签:mysql, php, sql, 上一页, 下一页, 分页, 搜索PHP MYSQL 分页 上一页 下一页 GO 搜索 www.yippeesoft.com
搜索的HTML代码 www.yippeesoft.com
<form name=formsearch action="?actname=search" method="post" target="_self">
<table border="0" cellspacing="1" cellpadding="4" bgcolor="#CCCCCC">
<tr bgcolor="#D4E5F7">
<td colspan="9"> www.yippeesoft.com
<p align="right"><font color="#FFFFFF"><b>操作员名称:</b></font><input name="namessearch" type="text" size="11" maxlength="20" >
<!– <img src="../images/gsearch.gif" > –>
<img style=cursor:hand src="../images/gsearch.gif" onClick="javascript:document.formsearch.submit()">
</td>
</tr>
分页的HTML代码 www.yippeesoft.com
<form name=formgo action="?actname=go" method="post">
<table cellSpacing="0" cellPadding="0" width="100%" border="0" id="table1">
<tr>
<td width="520" align="right">
<?php
echo "<a href=\\"?actname=pre&curnumm=$curnum\\">";
?>
上一页
<?php
echo "<a href=\\"?actname=next&curnumm=$curnum\\">";
?>
下一页</a> 共
<?="$curnum" ?>
/<?="$total"?> 页</td>
<td align="right">
<!–<input style="cursor:hand; float:right" name="save1" type="submit" value="GO">–>
<img style=cursor:hand src="../images/GO.gif" onClick="javascript:document.formgo.submit()"> www.yippeesoft.com
</td>
<td align="right"> www.yippeesoft.com
<input name="go" size="2" style="float: left" >
</td>
PHP代码 www.yippeesoft.com
$adminn=new clsadmin();
$adminn->$actname();
class clsadmin
&leftsign;
var $NumPerPage=2;
function next()
&leftsign;
global $curnumm;
$this->Show($curnumm+1);
&rightsign;
function pre()
&leftsign;
global $curnumm;
$this->Show($curnumm-1);
&rightsign; www.yippeesoft.com
function go()
&leftsign;
$this->Show($_POST["go"]);
&rightsign; www.yippeesoft.com
function search()
&leftsign;
$this->Show();
&rightsign; www.yippeesoft.com
登录到 Google Sitemaps(测试版) https://www.google.com/webmasters/sitemaps/login
https://www.google.com/webmasters/sitemaps/docs/zh_CN/stats.html Google Sitemaps(测试版)帮助
发现有一些新的变化
我的 Sitemaps
全部 Sitemaps 1 Sitemaps 协议 ?
错误 0 Sitemaps 常见问题解答 ?
Sitemaps &line; 查看: 全部 Errors &line; 添加一个 Sitemaps 文件 + Sitemaps 1 到 1 ,共 1 个
网站 Sitemaps 类型 已提交 最新下载时间 Sitemaps 状态 Sitemaps 操作
http://www.yippeesoft.com/blog/ – 确认 sitemap.php 網頁 六月 23 10 个小时前 确定 &line; 增加了一个 确认
确认网站: http://www.yippeesoft.com/blog/
Google 已经抓取了您的网站 http://www.yippeesoft.com/blog/ ,并将向您展示某些结果。然而,为确保我们不会将您网站的隐私信息透露给他人,我们需要确认您的所有权。
创建一个确认文件 www.yippeesoft.com
创建名为 GOOGLE43c1a59e17b94b37.html 的空文件。该文件使 Google 可以对您进行唯一确认。您可以在任何文本编辑器中创建该文件。该文件应为空,因为我们只是检查其是否与您的 Sitemaps 位于同一位置,而不会阅读其内容。 您可以在 此处阅读有关此文件的详细信息。
上传确认文件
您创建确认文件后,放置在您服务器上的 http://www.yippeesoft.com/blog/。
确认状态: http://www.yippeesoft.com/blog/GOOGLE43c1a59e17b94b37.html 未确认
按照步骤生成一个文件,上传,点击 确认 按钮
我们的系统正忙。请几分钟后重试。
确认状态: http://www.yippeesoft.com/blog/GOOGLE43c1a59e17b94b37.html 已确认 查看网站状态 ?
网站: http://www.yippeesoft.com/blog/
在我们的常规抓取过程中发现的网址
作为我们常规抓取过程的一部分,我们一直在抓取您的网站。这包括来自您的网页以及其他网站网页的以下链接。 以下我们列出了在此抓取过程中无法访问的网址,以及解释我们为什么无法访问的链接。
网址 错误 www.yippeesoft.com
http://www.yippeesoft.com/blog/wap/index.php?job=browse&page=3 网址无法访问
http://www.yippeesoft.com/blog/wap/index.php?job=browse&page=6 网址无法访问
http://www.yippeesoft.com/blog/wap/index.php?job=browse&page=4&cat= 网址无法访问
http://www.yippeesoft.com/blog/www.google.ch HTTP 错误
http://www.yippeesoft.com/blog/www.google.cl HTTP 错误
http://www.yippeesoft.com/blog/www.google.dk HTTP 错误
前面几个是WAP,后面几个可能是BLOG自动解析URL连接造成的组合~
$useragent = strtolower($_SERVER[\'HTTP_USER_AGENT\']);
if (strpos($useragent, \’googlebot\’) !== false)&leftsign;
return \’Googlebot\’; GOOGLE搜索引擎 www.yippeesoft.com
&rightsign;
if (strpos($useragent, \’msnbot\’) !== false)&leftsign;
return \’MSNbot\’; MSN搜索引擎
&rightsign;
if (strpos($useragent, \’slurp\’) !== false)&leftsign;
return \’Yahoobot\’; YAHOO搜索引擎
&rightsign;
if (strpos($useragent, \’baiduspider\’) !== false)&leftsign;
return \’Baiduspider\’; BAIDU搜索引擎
&rightsign;
if (strpos($useragent, \’sohu-search\’) !== false)&leftsign;
return \’Sohubot\’; 搜索引擎
www.yippeesoft.com
&rightsign;
if (strpos($useragent, \’lycos\’) !== false)&leftsign;
return \’Lycos\’;搜索引擎 www.yippeesoft.com
&rightsign;
if (strpos($useragent, \’robozilla\’) !== false)&leftsign;
return \’Robozilla\’;搜索引擎
&rightsign;
return false; www.yippeesoft.com
这是一些蜘蛛的名称,本来想在BLOG里面加上蜘蛛统计的,想想先放着~~~~,想到再说
标签:sitemaps, 搜索, 搜索引擎, 蜘蛛今天上GOOGLE搜索 SITE:SHENGFANG.ORG
发现:.::YippeeSoft开心软件- Subversion安装使用指南- YippeeSoft,开心软件 …
YippeeSoft,开心软件,开发心得,胡思乱想,编程思考,shengfang的blog.
www.yippeesoft.com/blog/index. php?job=art&articleid=a_20050714_113422 – 27k – 网页快照 – 类似网页 www.yippeesoft.com
以前看过什么SEO优化搜索引擎,这样就是表示关键字不对了。
看看模板K:\\php\\20050830\\blog\\blog\\template\\clean
<title>.::&leftsign;blogname&rightsign; – &leftsign;articletitle&rightsign;&leftsign;blogdc&rightsign;::.</title>
<meta name="keywords" content="YippeeSoft,开心软件,开发心得,编程思考,胡思乱想,shengfang的blog">
<meta name="description" content="YippeeSoft,开心软件,开发心得,胡思乱想,编程思考,shengfang的blog"> www.yippeesoft.com
这就难怪了,显示出来就是
http://www.yippeesoft.com/blog/p/perl4errlog.php
<title>.::YippeeSoft开心软件 – perl4编程出错信息 – YippeeSoft,开心软件,开发心得,编程思考,胡思乱想,shengfang的blog博客部落格::.</title>
<meta name="keywords" content="YippeeSoft,开心软件,开发心得,编程思考,胡思乱想,shengfang的blog">
<meta name="description" content="YippeeSoft,开心软件,开发心得,胡思乱想,编程思考,shengfang的blog">
修改为:
<title>&leftsign;articletitle&rightsign;</title>
<meta name="keywords" content="&leftsign;articletitle&rightsign;">
<meta name="description" content="shengfang blog &leftsign;blogdc&rightsign; .::&leftsign;blogname&rightsign; -::. ">
显示出来~
<title>perl4编程出错信息 – </title>
<meta name="keywords" content="perl4编程出错信息 – ">
<meta name="description" content="盛放漫敲 shengfang blog YippeeSoft,开心软件,开发心得,编程思考,胡思乱想,shengfang的blog博客部落格 .::YippeeSoft开心软件 -::. ">
修改INDEX.PHP:
if($job==\’art\’)
$t -> set_var(array("articletitle"=>$articlename));
else
$t -> set_var(array("articletitle"=>$blogname));
$fp = fopen("rsscount.txt", "r");
这样首页的时候才不会为空,也不会全部都是 BLOGNAME 名称,不一定要ARRAY,只是COPY而已
从网络上搜集的一些资料[quote]
■ 关键词的使用
我们寻找关键词的目的就是为了要将它们用在网页中。看了前面有关搜索引擎工作原理以及网页排名规则的介绍,你也许还记得搜索引擎是如何对用户的查询作出反应的。它首先以输入的关键词为搜索条件,在其数据库中检索包含该关键词的网页,然后按照“匹配/位置/频次”原则返回网站排名搜索结果。
所以为了让你的网页出现在以事先确定的关键词为条件的搜索结果中,你就必须在网页中使用关键词。放置关键词的地方包括:标题、META标签、网页正文、ALT标签等等。但有一点要注意,不要过分重复某单个的关键词(spam),而且也不能象在META关键词标签中那样简单地排列关键词(也是spam),而是应该遵循必要的语法规则,形成自然流畅的语句,让访问者看起来觉得很舒服,同时还要顾及对顾客是否具有足够的吸引力。总之牢记一个原则:对访问者有吸引力和价值的内容,搜索引擎也不会熟视无睹。
确实,这项工作不容易,但只要我们肯下工夫,将思维发挥到极致,就一定会得到满意的结果。
title撰写,这是一个非常有成效的工作,即让客户的关键字合理的出现在title标题中,比如客户的关键词是“投影机”那出现的标题就应该是“品牌 投影机≡华海投影设备公司”
在关键词前要出现一般两个字符 关键词 标准分割符(通用)
title撰写的字数不要超过15字(汉字),尽量不要出现重复关键词,但是要出现相关关键词
Meta Keywords 的提炼、放置,使一些未购买的关键词都有被搜索到的可能,关键词的强调也是很重要的,不推荐放很多关键词
1、关键词策略:
确定网站的核心关键词。网页中一切可让搜索引擎抓取的文本中都尽量带有关键词。这些地方包括:域名、title和meta标签、正文、链接文本、文件名、alt、header标签(即正文标题≮H1≯, ≮H2≯, ≮H3≯等)。让你的关键词无所不在,但又避免在同一处堆砌过多。
关键词选择技巧:相关性(即定位)、热门度的掌握(太热不好容易排前,太冷没人搜索)
对网页的要求:
(1)每个页面都应当有title, description, keywords的内容,该内容由营销人员确定,技术人员制作网站时加入,每个页面title根据该页面内容确定,description和keywords可以相同;
(2)应当制作一个用文字(最好是关键字)组成的网站导航页,确保导航页面从首页链接;
(3)网页名字的命名应当尽量采用关键字;
(4)在客户有多个产品的情况下,针对不同的产品分设不同的文件夹,其中用于导航的产品命名为index.htm;
(5)每个页面的最后一行应当有一个关键字的链接,大小采用标题5(h5)。可以体现为copyright的形式;
(6)网页制作中,如果源程序中“charset=gb2312”,gb2312意为中文字符,如果是做英文网站,应将“gb2312”改为“iso-8859-1”。
title和meta标签策略:
搜索引擎优化基本功:title标题内容将以链接标题的形式显示于搜索结果页面。标题一般是网站名称+简短描述,含核心关键词,
meta中的关键词(keywords)和描述(description):确定几个核心关键词及组合,关键词以3-5个为宜,最好不要超过15个,以避免堆砌之嫌。描述是网站的简短说明,含有关键词。
如果每个主要页面的内容相差很大,则应根据网页内容不同而改变title和meta标签,不要全部网页都采用首页的标题和标签。
网页文本内容需出现该页关键词,关键词密度在3%-7%之间。太多有堆砌之嫌。
搜索结果页面在链接标题之后显示的描述文字一般是搜索引擎在本页正文中最先抓取到的含有关键词的那段文本。据说通常在网页左上角方向出现这段文字最有利。
[/quote]
每天看看各种网页,有些是看了就了事,有些看完发现有些现象值得留意一下,随手记录
2004-02-26 出乎我的 意料,AOC这么多型号 LCD 过了 TCO99 还OEM有那么多的 品牌
Fujitsu-Siemens aigo IBM HP COMPAQ DELL NEC MITSUBISHI QDI SHARP
http://tco.networks.nu/index_publicsearch.htm
2004-02-22 FTP 使用了CUTEFTP、FLASHFTP、LEAPFTP等工具软件,CUTEFTP功能比较强大,但是不够绿色,很多东西都放在了WINDOWS的系统用户目录下,并且每次启动还把上次的页面打开。不过它可以同时访问多个网站。但是不知道是不是汉化的问题,有时总是会失去响应;FLASHFTP比较绿色,使用比较简单,一次只能访问一个站点,LEAPFTP也差不多。但是目前大部分FTP站点好像都是使用被动模式,在公司,由于有防火墙,经常没有办法访问,一LIST程序就只能退出。幸好我使用的BLOG自带有上传模块,省掉了很多麻烦,然而还是有些不足,所以我在另外一个免费PHP站点上传了一个MYWEBFTP,安装之后,就可以通过浏览器进行FTP操作了。搜索了一下,好像PHP本身就支持FTP系列函数。搜索了许多PHP WEBFTP源码,有一个国产的,看上去的确不错,不过在我的浏览器上总是闪烁的很厉害,不知道为什么。用MYWEBFTP,虽然是DEMO个人版本,很多功能没有开放,不过对于我偶尔用用的话,还是绰绰有余的。
今天儿子的湿疹越来越厉害了,实在令人心痛加心烦,随便写写。DONEWS越来越不稳定,可以考虑只在YESKY和CSDN了,毕竟我也不是专门玩笔杆子的。
MYWENFTP不提供下载功能,又搜索了一通,这个不错,简单明了
upsdn.net 的 Ftp Web-Client V1.0 RC1,
还有一个开源的,不过那个好像不怎么能用 phpWebFTP セ 2.7 台湾汉化版本
© 2002-2004, Edwin van Wijk,
www.v-wijk.net
2004-02-18 山东 华为山东公司似乎是一个专门给华为作技术支持的部门,今天看到CMCC的连接,顺手访问一级网站,结果发现是 榕基 山东公司,从网页内容来看,似乎也是客服。
是不是山东对于IT公司有什么特殊优惠?以致他们都在山东作专门的客户公司?
许久以前,还在IHAO的时候,当时在一个国外网站登记了这个网站,并且发表了一些在论坛,结果从IHAO的历史记录看到很多MSN蜘蛛的记录。后来搬到512J,有时偶尔发现两人在线,一查IP,也是微软公司的。后来看统计记录,发现居然有从3721过来的,实在令人惊讶,后来想想微软的关系就明白了。
不过不久GOOGLE也登录了不少页面。现在YAHOO和YISOU都基本上是全部登录了页面,只有BAIDU仍然很少,发了一个EMAIL给BAIDU网管,好像多了一点。
Fujitsu-Siemens aigo IBM HP COMPAQ DELL NEC MITSUBISHI QDI SHARP TCO 上的 AOC
标签:ftp, 乱七八糟, 搜索