• 折腾Python人人爬虫的收获

    [Python]
    post by Holmesian / 2011-8-31 20:22 Wednesday

         晚上折腾Python写人人网爬虫,目标是所有好友的相册和个人资料以及通讯录信息,目前相册抓取借助网上一位TX发现的人人相册的小Bugs已经实现,晚上对两个以前不喜欢用的功能颇有所得,在这里暂且记录一下。

         首先是Python内置的数据库引擎Shelve,Python的数据持久化操作主要有六类:普通文件、...

    阅读全文>>