The Meaning of Text Mining

“Shirong’s boss is very interesting in date mining.” Guochang said.

暨大体育分享了你的身份信息

这些还是写在博客让有心人看就好(振兴同学的建议总是那么的中用)

stocktwits crawer Notes

“I’m done!”, this sentence fills my brain after an interview yesterday. It’s obvious that I just talk to myself in Chinese first then translate them to English in my head when I speak English. So when you read this post, you may thought this author is an idiot because this post may has lots of spell mistakes, grammar mistakes etc. However, “I have to learn English sooner or later”, means I have to take this step sooner or later. This is my first post write in English and I think it’s interest if you use the translate tools of Google or Firefox to translate this post into English. Hope you have a good read experience.

爱奇艺爬取记

这图还是爬东西时随意收集的。

我还会回来的

当五位小朋友长大后看到这个,不知怎的印象:

“保险”心得和pcomic爬取记

“保险”心得

昨天和鱼油同学聊到随机过程中的马尔科夫,这玩意真是,在统计预测和决策里面有,在非寿险的NCD系统里面也有。不过我目前只能学到“$\pi$来$\pi$去”的程度,这是随机过程自己挖的坑,只能以后自己填补。

快看漫画爬取记

计算算不出来,证明看不懂题目。为了自己看卷时有一个好心情,以后大学考试只能考加减法,乘除法都不要考。

——孤狼


Unsplash爬取记

今天上传了建Blog以来最大的一张图,有8.14MB,对,就是下面这货。


风之动漫爬取记

尚未佩妥剑,转眼便江湖。愿历经千帆,归来仍少年。

kugou爬取记

弗兰奇,这世上可没有海贼船的设计图,挂上了骷髅旗就是海贼船,挂上海鸥旗就成了海军船。不管你想造什么船,对自己造的船,男子汉都要昂首挺胸!

彼岸图网爬取记

JWen

指导老师:程振兴

又是一个激动人心的夜晚,这是振兴和我爬取的第2个网站:彼岸图网

基础爬虫的套路:通过copy命令得到网页源代码,然后将源代码读入Stata,进行字符串的处理,最终整合成我们需要的信息。这是我爬取的第2个网站,是因为第1个是妹子图,不过最后命令写完了才发现,copy命令并不能爬取到我们所要的图片(因为妹子图设置了防盗链)。看来“网络爬虫最难的不是字符串处理,而是如何得到目标数据的源代码。”真是灵验,后续这个问题我们用curl命令解决。

敲黑板了!!!
本博客是在icarus基础上,振兴怒改,JWen小改后完成的。
R Stata
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×