目录
selenium执行js常见的selenium监测手段常用绕过selenium监测1常用绕过selenium监测2常用绕过selenium监测3常用绕过selenium监测4selenium执行js
优点:直接调用浏览器的环境
障碍:绕过selenium监测
原理:
# 执行js代码 bro.execute_script("js代码")
常见的selenium监测手段
正常登录 window.navigator.webdriver == undefined
自动化的 window.navigator.webdriver == true
除此之外,还有一些其它的标志性字符串(不同的浏览器可能会有所不同),常见的特征串如下所示:
webdriver __driver_evaluate __webdriver_evaluate __selenium_evaluate __fxdriver_evaluate __driver_unwrapped __webdriver_unwrapped __selenium_unwrapped __fxdriver_unwrapped _Selenium_IDE_Recorder _selenium calledSelenium _WEBDRIVER_ELEM_CACHE ChromeDriverw driver-evaluate webdriver-evaluate selenium-evaluate webdriverCommand webdriver-evaluate-response __webdriverFunc __webdriver_script_fn __$webdriverAsyncExecutor __lastWatirAlert __lastWatirConfirm __lastWatirPrompt $chrome_asyncScriptInfo $cdc_asdjflasutopfhvcZLmcfl_
了解了这个特点之后,就可以在浏览器客户端JS中通过检测这些特征串来判断当前是否使用了selenium,并将检测结果附加到后续请求之中,这样服务端就能识别并拦截后续的请求。
常用绕过selenium监测1
正常登录 window.navigator.webdriver == undefined
自动化的 window.navigator.webdriver == true
from selenium import webdriver options = webdriver.ChromeOptions() # 此步骤很重要,设置为开发者模式,防止被各大网站识别出来使用了Selenium options.add_experimental_option("excludeSwitches", ["enable-automation"]) #停止加载图片 options.add_experimental_option("prefs", {"profile.managed_default_content_settings.images": 2}) browser = webdriver.Chrome(options=options) browser.get("https://www.taobao.com/")
常用绕过selenium监测2
from selenium import webdriver chrome_options = webdriver.ChromeOptions() chrome_options.add_experimental_option("debuggerAddress","127.0.0.1:9222") browser=webdriver.Chrome(executable_path=r"C:\Users\TR\AppData\Local\Google\Chrome \Application\chromedriver.exe",chrome_options=chrome_options) browser.get("http://www.zhihu.com")
终端输入如下指令:chrome.exe --remote-debugging-port=9222 --user-data-dir=“D:\cdsf”(需要谷歌驱动在系统环境变量下,然后再运行程序)
remote-debugging-port是你代码中指定的端口debuggerAddress;executable_path是你谷歌驱动位置;user-data-dir随便指定一个目录就行
常用绕过selenium监测3
1.使用chrome的远程调试模式结合selenium来遥控chrome进行抓取,这样不会携带指纹信息
步骤:
- 使用调试模式手工启动chrome,进入chrome的安装路径,例如chrome装在 C:\program\google\chrome.exe下
- 进入chrome安装路径
- 执行命令:
#注意端口不要被占用,防火墙要关闭,user-data-dir用来指明配置文件的路径
chrome.exe --remote-debugging-port=9222 --user-data-dir="指向任意空文件夹"
2.启动完·之后新建python文件
运行代码:
import requests from selenium import webdriver chrome_options = "C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chrome.exe" chrome_options = webdriver.ChromeOptions() chrome_options.add_experimental_option("debuggerAddress","10.8.13.95:9222") browser = webdriver.Chrome(chrome_options=chrome_options) browser.get("https://www.zhihu.com/signup?next=%2F") # chrome.exe --remote-debugging-port=9222 --user-data-dir="D:\moni"
这样监测的就不是selenium模拟了
常用绕过selenium监测4
def selenium(js): option = webdriver.ChromeOptions() # option.add_argument("--headless") option.add_experimental_option("useAutomationExtension", False) option.add_experimental_option("excludeSwitches", ["enable-automation"]) bro = webdriver.Chrome(executable_path="./chromedriver", options=option) # 弹出浏览器,要给浏览器驱动的地址 # 打开页面优先执行的js,execute_cdp_cmd bro.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", { "source": """ Object.defineProperty(navigator, "webdriver", { get: () => undefined }) """ }) bro.implicitly_wait(10) bro.get("https://www.toutiao.com/") time.sleep(5) print(bro.page_source) # 获取页面返回的html代码 bro.execute_script(js) input()
以上就是selenium执行js并绕过webdriver监测常见方法的详细内容,更多关于selenium执行js绕过webdriver监测的资料请关注脚本之家其它相关文章!
X 关闭
X 关闭
- 15G资费不大降!三大运营商谁提供的5G网速最快?中国信通院给出答案
- 2联想拯救者Y70发布最新预告:售价2970元起 迄今最便宜的骁龙8+旗舰
- 3亚马逊开始大规模推广掌纹支付技术 顾客可使用“挥手付”结账
- 4现代和起亚上半年出口20万辆新能源汽车同比增长30.6%
- 5如何让居民5分钟使用到各种设施?沙特“线性城市”来了
- 6AMD实现连续8个季度的增长 季度营收首次突破60亿美元利润更是翻倍
- 7转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 8充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 9好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 10名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?