最新发布 第19页

宁哥的小站专注数据挖掘、机器学习方向。

数据挖掘与机器学习

验证码识别的概述

验证码识别的概述
在我们采用用户名密码登陆网站的过程中,或者提交一些信息的过程中,经常会遇到提示用户名输入验证码的情况,而且每次刷新,验证码都会随机生成不一样的数字或字母序列,甚至文字序列。而这段验证码字符序列,就是生成在图片之中,与网页文本格式不同,验证码图片里面的字符序列不仅风格迥异,有时不好...

fireling 10年前 (2015-01-26) 7210℃ 0评论 7喜欢

Java

Java中实现unicode格式转中文

Java中实现unicode格式转中文
在数据抓取过程中,从网站api获取的json格式数据位unicode编码,如果要存到MongoDB数据库中显示正常的话,需要我们进行编码格式的转换。 下面贴一段在Java程序中实现unicode转中文的代码: 大家仔细体会吧。。比较变态的是,Java里面没有原生字符串raw s...

fireling 10年前 (2015-01-23) 7464℃ 0评论 12喜欢

Linux

Ubuntu安装虚拟机vwware-tool

Ubuntu安装虚拟机vwware-tool
点击VMware菜单的VM,Install VMware Tools,将VMwareTools-xxx.tar.gz解压缩到桌面,桌面上存在vmware-tools-distrib目录。 打开终端Ctrl+Alt+T,进入vmware-tools-distrib目录,输入命令su...

fireling 10年前 (2015-01-23) 8808℃ 0评论 2喜欢

网络爬虫

1. 最基本的爬虫

1. 最基本的爬虫
网络爬虫是当前互联网比较流行的概念,特别是对于搜索引擎、数据处理等,都需要我们从网上去“取”一些符合要求的数据。总的来说,一般的爬虫分为两个功能模块,也就是取数据和存数据。 取数据是爬虫的关键,特别对于一些具有“防御性”的情况,比如说网站需要登陆的情况,需要挂代理访问的情况,需要...

fireling 10年前 (2015-01-23) 27215℃ 0评论 182喜欢

个人随笔

关于个人

关于个人
2015年了,新的一年要有新的气象。对于自己来说,越来越喜欢互联网这个大圈,虽然过去的一年没有任何事业上的突破,但是互联网给自己带来的乐趣,远远不能用“充实”来表达。 对于技术,很多人会远离,会逃避,曾经的我,也不例外。我曾经觉得,做技术是件很苦逼的事情,特别是你在自己的小天地里...

fireling 10年前 (2015-01-23) 8100℃ 0评论 58喜欢