Python自动采集微信联系人的实现示例
(编辑:jimmy 日期: 2025/1/16 浏览:3 次 )
疫情终于有所好转了,感谢所有的为之奋斗的白衣天使们,你们是最棒的!赞!
白衣天使们在前线奋战,我们也总不能总在家里躺着做贡献,也要加强学习,争取开春有个好工作:)
这周花了几天的时间,把Python的pywinauto相关的使用及一堆的库函数看了一遍,感觉这个库还是非常强大的。
pywinauto是什么?
pywinauto是一组用于自动化Windows GUI的python模块。简单地说,它允许您将鼠标和键盘操作发送到windows对话框和控件。这是官方的解释,简单说就是可以用python代码来操纵桌面程序。
安装
pip install pywinauto
使用
pywinauto的使用方式原理很简单,但是它提供了大量的对GUI界面元素操作的函数,需要慢慢去理解。
官方文档资料很齐全:https://pywinauto.readthedocs.io/
入门级的细节就不说了,看不懂官方英文,也可以去网上搜索,一大堆的介绍文档。
我们直接进入今天的主题:用Python采集微信联系人,先上程序执行效果视频:
程序原理
(1)首先微信要打开,并登录成功。获取当前微信的进程ID:
PID=0 for proc in psutil.process_iter(): try: pinfo = proc.as_dict(attrs=['pid','name']) except psutil.NoSuchProcess: pass else: if 'WeChat.exe' == pinfo['name']: PID = pinfo['pid']
(2)使用pywinauto 连接到这个进程:
app = Application(backend='uia').connect(process=PID) win = app[u'微信']
(3)找到左边的“通讯录”按钮所在位置,点击鼠标:
addresslist = win.child_window(title=u"通讯录", control_type="Button") addresslist.draw_outline() cords = addresslist.rectangle() pywinauto.mouse.click(button='left', coords=(cords.left + 10, cords.top+10)) win.draw_outline()
(4)核心代码,通过调用向下的键盘指令,逐个打开联系人详情页,根据详情页的页面结构,页面内的所有数据:呢称、备注、地区、微信号、来源。
#联系人 con_list = win.child_window(title=u"联系人", control_type="List") pywinauto.mouse.click(button='left', coords=(cords.left + 100, cords.top+10)) data = [] while True: con_list.type_keys("{DOWN}") rect_edit = win.Edit2.rectangle() #找到联系人详情页 if rect_edit.left > cords.left + 300: #整个面板 page = {u'呢称':'',u'备 注':'',u'地 区':'',u'微信号':'',u'来 源':''} #呢称 win.Edit2.draw_outline() page[u'呢称'] = win.Edit2.get_value() #由于详情页面要素不固定,不能用控件序号来检索 static_wxh = win.child_window(title=u"微信号", control_type="Text") Pane46 = static_wxh.parent().parent() for item in Pane46.children(): item.draw_outline() lines = item.children() key = lines[0].window_text() value = lines[1].window_text() page[key] = value data.append(page) #最后一个联系人时停止 if len(data) >2 and data[-2][u'微信号'] == data[-1][u'微信号']: data.remove(data[-1]) saveTxt(data) break
第四步的方法前后优化过多次,这是最后优化的版本,这个版本是多种方案中速度最快,同时兼容性最好的方法,如果哪位朋友还有更好的方案,欢迎留言讨论!
下面附上完整代码:
#coding=gbk ''' Created on @author: Administrator ''' import psutil import pywinauto from pywinauto.application import Application import os import sys reload(sys) sys.setdefaultencoding('utf-8') def getWinxin(): PID=0 for proc in psutil.process_iter(): try: pinfo = proc.as_dict(attrs=['pid','name']) except psutil.NoSuchProcess: pass else: if 'WeChat.exe' == pinfo['name']: PID = pinfo['pid'] app = Application(backend='uia').connect(process=PID) win = app[u'微信'] addresslist = win.child_window(title=u"通讯录", control_type="Button") addresslist.draw_outline() cords = addresslist.rectangle() pywinauto.mouse.click(button='left', coords=(cords.left + 10, cords.top+10)) win.draw_outline() #联系人 con_list = win.child_window(title=u"联系人", control_type="List") pywinauto.mouse.click(button='left', coords=(cords.left + 100, cords.top+10)) data = [] while True: con_list.type_keys("{DOWN}") rect_edit = win.Edit2.rectangle() #找到联系人详情页 if rect_edit.left > cords.left + 300: #整个面板 page = {u'呢称':'',u'备 注':'',u'地 区':'',u'微信号':'',u'来 源':''} #呢称 win.Edit2.draw_outline() page[u'呢称'] = win.Edit2.get_value() #由于详情页面要素不固定,不能用控件序号来检索 static_wxh = win.child_window(title=u"微信号", control_type="Text") Pane46 = static_wxh.parent().parent() for item in Pane46.children(): item.draw_outline() lines = item.children() key = lines[0].window_text() value = lines[1].window_text() page[key] = value data.append(page) #最后一个联系人时停止 if len(data) >2 and data[-2][u'微信号'] == data[-1][u'微信号']: data.remove(data[-1]) saveTxt(data) break def saveTxt(data): with open("data.txt",'ab') as f: f.write(u'微信号,备注,地区,来源,呢称\r\n') for item in data: f.write('%s,%s,%s,%s,%s\r\n' % (item[u'微信号'],item[u'备 注'],item[u'地 区'],item[u'来 源'],item[u'呢称'])) os.system('notepad.exe data.txt') if __name__ == '__main__': getWinxin()
下一篇:python代码实现TSNE降维数据可视化教程