初学Python爬虫
大数据时代,数据无价
我最近研究了了qq空间的模拟登陆,程序拿到权限之后可以“为所欲为”。
想了想可以实现的玩法,欢迎补充。
理论可以实现的功能如下:
获取自己的说说列表
获取好友的说说列表
说说的点赞和评论情况
以及一些自然人刷空间可以获取到的所有信息
普通点的玩法:
- 批量自动点赞评论
- 尝试访问所有好友空间,可以知道有哪些好友对自己锁了空间
高级点的大数据玩法:
- 分析近段时间好友关注热点(对说说内容进行分词、统计关键词热度)
- 获取所有说说的评论列表和点赞列表,构建关系网络图像。可以有限的还原社交圈。
- 订阅某人的说说(进行语义分析,分析文字情感值,绘制情绪曲线)
- 识别说说中图片,有人脸则下载(自动下载空间里好友的自拍照片)
- 统计分析好友作息规律,绘制曲线图
- 统计分析好友使用的手机,综合年龄等数据,有限还原生活水平