
由Google Labs开发的这一服务将对公开发布的代码进行索引━━其中大多数是开放源代码。Google的一名产品经理汤姆说,这一服务包括在网页上显示的代码和以压缩格式存储的代码。
Google预计这一软件代码搜索引擎将主要被用作学习工具,帮助学生和编程人员学习更多的编程知识,而不会成为“剽窃”其他人代码的工具。汤姆说,大部分代码是开放源代码,因此用户可以使用它们,但我认为这不是它的主要用途━━它将被更多地用于学习编程知识。例如,开发人员可能需要编写一个函数,会在Web上搜索类似的例子。
Google的编程人员已经在公司内部使用这种代码搜索能力。汤姆说,由于是Google Labs的一个项目,Google还没有通过投放广告利用该服务赚钱的计划。汤姆表示,这一搜索引擎使人们能够进行关键字搜索和“规则表达式”搜索。例如,用户可以将搜索的范围限定为JavaScript函数,这将有助于找到更多的范例代码。
尽管并不销售编程工具,Google一直在积极地吸引编程人员,依赖第三方编程人员增强其服务。例如,编程人员已经利用Google Maps开发了一个大受欢迎的mashup应用软件。汤姆说,越来越多的编程人员社区是Google产品走向大众的“途径”,我们认为开发人员能够改进Google的产品,并利用Google的技术改进他们自己的产品。
Digg上面已经有人利用Google代码搜索找到知名软件的破解过程了(注册码、序列号等),方法是直接搜索"keygen"、"serial"、"name"及各大破解组织的名称。这里有个例子。
对其危害,也有Google Code Search搜出Wordpress database密码的报道。
wp-config.php记录了用于连接数据库用户名和密码,目前的情况是有将近50个wp-config.php得到了收录,而且可以看到username和password,而这些文件都是以ZIP和TAGBALL格式存放的。
如何不想让Google索引机密性文件,可以使用robot.txt告诉Google不要抓取。
所谓“服务器上以压缩格式存放的wordpress文件的备份”是在如果你有备份的前提下说的,这个压缩文件并不是本身就存在的,Google所收录的若干个记录可能就是不慎把自己的Wordpress文件以压缩格式备份在服务器的人的。
Google Code Search is a new search engine created by Google that "helps you find function definitions and sample code by giving you one place to search publicly accessible source code hosted on the Internet". You can restrict your search to a certain language, license, file or package. You can also use regular expressions, so don't forget to escape characters like space (for example, for\ \(;;\)).
Google does a good job at finding duplicates, and locating a file in a package.
关于Google Code Search的更多使用细节可以在Google网站上找到更多技巧。
关于:阿里巴巴,SEO,雅虎,吴炯
关于:熵,信息论,Information Entropy
2006/10/09 22:28 | by 





