原作者: Dave Cross
发表:August 10, 2004
原名: Perl Command-Line Options
原文: http://www.perl.com/pub/a/2004/08/09/commandline.html
Perl有很多命令行参数。通过它们, 我们有机会写出更简单的程序。在这篇文章里我们来了解一些常用的参数。
原作者: Dave Cross
发表:August 10, 2004
原名: Perl Command-Line Options
原文: http://www.perl.com/pub/a/2004/08/09/commandline.html
Perl有很多命令行参数。通过它们, 我们有机会写出更简单的程序。在这篇文章里我们来了解一些常用的参数。
显示任务执行信息,去掉过程和错误信息
rex -qw uptime
把执行结果存到文件中
rex -qw uptime | tee -a info.log
指定主机执行
rex -qw -H ‘192.168.1.1 192.168.1.2’ uptime
(R)?ex 是一个不需要在受控主机运行客户端的服务器流程工具。它采用 ssh 方式来执行指定的命令。
开始使用 (R)?ex 并不需要 Perl 基础。(R)?ex 提供了简单的 DSL 来描述你的服务器。甚至,你可以在你的 shell 脚本里使用 (R)?ex,完全不需要使用 perl。
由于IE6的盒模型计算缺陷,padding-right在特定的情况会下导致抖动。 [出现抖动的代码]
简单的掷骰器
许多游戏和游戏系统都需要骰子。让我们先从简单的部分入手:掷一个六面骰子。实际上,滚动一个六面骰子就是从 1 到 6 之间选择一个随机数字。在 PHP 中,这十分简单:echo rand(1,6);。
在许多情况下,这基本上很简单。但是在处理机率游戏时,我们需要一些更好的实现。PHP 提供了更好的随机数字生成器:mt_rand()。在不深入研究两者差别的情况下,可以认为 mt_rand 是一个更快、更好的随机数字生成器:echo mt_rand(1,6);。如果把该随机数字生成器放入函数中,则效果会更好。
在PHP开发中,有时候需要在内 部网中进行开发。对于数据收集项目,有时候服务器需要连接Internet网络来获取Internet网络上的信息。但是,如果公司是通过防火墙上网,一 般的file_get_post_content函数就不行了。当然,通过一些socket操作,直接向proxy写http请求也是可以的,但是比较麻烦。本文讨 论用CURL库的简单代理实现。
很赞的一张图
以前说过如果JS文件不是UTF8会在IE有bug,所以JS代码也要用UTF-8。还有数据库也都要用UTF-8。
php(做为现在的主流开发语言)用UTF-8总结:
Web 流量分析工具多不胜数,从 WebTrends 这样专业而昂贵的,到 Google Analytics 这样强大而免费的,从需要在服务器端单独部署的,到可以从前端集成的,不一而足。本 文收集并介绍了10个功能强大的开源 Web 流量分析工具,因为是开源的,因此可以免费部署到你的网站。
TraceWatch 是一个开源 Web 流量分析程序,支持实时分析,可以提供深度分析报告。
基于 PHP-MySQL,同时,可以像 Google Analytics 那样,通过 JavaScript 或 PHP 脚本集成到网站。
可以生成站点的详细的实时访问报告,基于 PHP 和 MySQL,也可以像 Google Analytics 那样在前端集成。
基于 PHP,内置对 WordPress,Gallery 以及 MediaWiki 的支持。
W3Perl 是一个 Web Log 分析工具。
CrawTrack 是一个很好的 Google Analytics 的开源替用品,提供非常独特的报告,比如,CrawTrack 可以帮你预防诸如 SQL 注射一类的攻击。
BBClone 是一个 Web 计数器,可以提供很详细的访问报告。基于 PHP。
基于 GNU/GPL 开源协议,可以提供很详细的,有关访问者信息的报告,它的 GUI 界面很有趣而且实用,安装也很简单。
可以提供非常强大的,关于网站,FTP 站点,乃至 Email 服务器的访问分析报告,基于 CGI。
Grape 的界面比较简单,功能虽然不多,但很实用。
从前面的我讲的采集原理大家可以看出,绝大多数采集程序都是靠分析规则来进行采集的,如分析分页文件名规则、分析页面代码规则。
一、分页文件名规则防采集对策
大部分采集器都是靠分析分页文件名规则,进行批量、多页采集的。如果别人找不出你的分页文件的文件名规则,那么别人就无法对你的网站进行批量多页采集。