最新发布 第14页

宁哥的小站专注数据挖掘、机器学习方向。

Linux

Linux下添加环境变量

Linux下添加环境变量
$PATH:决定了shell将到哪些目录中寻找命令或程序,PATH的值是一系列目录,当您运行一个程序时,Linux在这些目录下进行搜寻编译链接。 编辑你的PATH声明,其格式为: PATH=$PATH:<PATH 1>:<PATH 2>:<PATH ...

fireling 9年前 (2015-08-20) 8670℃ 0评论 3喜欢

网络爬虫

Python入门网络爬虫之精华版

Python入门网络爬虫之精华版
Python入门网络爬虫之精华版 Python学习网络爬虫主要分3个大的版块:抓取,分析,存储 另外,比较常用的爬虫框架Scrapy,这里最后也详细介绍一下。 首先列举一下本人总结的相关文章,这些覆盖了入门网络爬虫需要的基本概念和技巧:宁哥的小站-网络爬虫 当我们在浏览器中...

fireling 9年前 (2015-08-19) 50396℃ 0评论 170喜欢

网络爬虫

6. 网络爬虫-验证码登陆

6. 网络爬虫-验证码登陆
验证码是一种非常有效的反爬虫机制,它能阻止大部分的暴力抓取,在电商类、投票类以及社交类等网站上应用广泛。如果破解验证码,成为了数据抓取工作者必须要面对的问题。 在访问某些网站时,我们最初只是需要提供用户名密码就可以登陆的,比如说豆瓣网,如果我们要是频繁登陆访问,可能这时网站就会出...

fireling 10年前 (2015-08-05) 38208℃ 0评论 78喜欢

Python

Python生成器代码应用举例

Python生成器代码应用举例
在写程序中,我们要注意总结一些常用技巧,比如说List Comprehensions,Dict Comprehensions,Generator以前其他的一些提高效率的写法。 在Generator中,一种很常见的用法就是yield的使用,每次在调用Generator的next()...

fireling 10年前 (2015-07-31) 6779℃ 0评论 1喜欢