NLTK ( Natural Language Toolkit ) 包是Python中常用的自然语言处理工具包。下面我介绍一下如何在搭建NLTK环境。
首先到 http://www.lfd.uci.edu/~gohlke/pythonlibs/#python-dateutil ...
fireling
9年前 (2015-08-20) 8520℃ 0评论
2喜欢
1、安装python
这一步很简单,直接双击运行python的安装程序,按照向导一路next即可。在路经方面建议设置一个比较好找的目录。这样,其它的python相关的资源就都可以组织进这个目录里面了。
2、安装PIL
3、安装Mysqldb
4、安装Django
解压到pytho...
fireling
9年前 (2015-08-20) 6925℃ 0评论
3喜欢
解压
sudo tar -zxvf ./jdk-linux-i586.tar.gz -C /usr/lib/jvm
配置环境变量
gedit ~/.bashrc
添加:
export JAVA_HOME=/usr/lib/jvm/jdkxxx
expor...
fireling
9年前 (2015-08-20) 5737℃ 0评论
1喜欢
$PATH:决定了shell将到哪些目录中寻找命令或程序,PATH的值是一系列目录,当您运行一个程序时,Linux在这些目录下进行搜寻编译链接。
编辑你的PATH声明,其格式为:
PATH=$PATH:<PATH 1>:<PATH 2>:<PATH ...
fireling
9年前 (2015-08-20) 8592℃ 0评论
3喜欢
Python入门网络爬虫之精华版
Python学习网络爬虫主要分3个大的版块:抓取,分析,存储
另外,比较常用的爬虫框架Scrapy,这里最后也详细介绍一下。
首先列举一下本人总结的相关文章,这些覆盖了入门网络爬虫需要的基本概念和技巧:宁哥的小站-网络爬虫
当我们在浏览器中...
fireling
9年前 (2015-08-19) 50218℃ 0评论
170喜欢
验证码是一种非常有效的反爬虫机制,它能阻止大部分的暴力抓取,在电商类、投票类以及社交类等网站上应用广泛。如果破解验证码,成为了数据抓取工作者必须要面对的问题。
在访问某些网站时,我们最初只是需要提供用户名密码就可以登陆的,比如说豆瓣网,如果我们要是频繁登陆访问,可能这时网站就会出...
fireling
9年前 (2015-08-05) 38055℃ 0评论
78喜欢