Hidemium Docs
  • 👋HIDEMIUM GUIDANCE FROM A-Z
  • FEATURES OF HIDEMIUM
    • NEW PROFILE
      • MAIN
      • PROXIES
      • COOKIES
      • HARDWARE
      • FONTS
      • BOOKMARKS
      • EXTENSIONS
      • AUTOFILL
      • OTHER CONFIG
    • PROFILES
      • Export All Data
      • Update Multiple
      • Quick Create
      • Change Proxy
      • Add Schedule
    • FOLDERS
    • PROXIES
  • Use Cases
    • 🤖API AUTOMATION V2
      • Remote profile
        • 1. Open profile
        • 2. Close profile
        • 3. Checking
      • Get profile
        • 1. List profile
        • 2. List config default
        • 3. List status
        • 4. List tag
        • 5. List version
        • 6. Get profile by uuid
        • 7. Get list folder
      • Interact profile
        • 1. Create profile by default
        • 2. Create profile customize
        • 3. Change fingerprint
        • 4. Update note
        • 5. Update name
        • 6. Sync tags
        • 7. Change status
        • 8. Delete profile
      • Proxy
        • 1. Update proxy
        • 2. update profile's proxy
      • Automation
        • List scripts
  • AUTOMATION USER MANUAL
    • Navigator
      • New tab
      • Active tab
      • Close tab
      • Open url
      • Reload page
      • Screenshot
      • Switch Frame
      • Switch Extension popup
      • Go back
    • AI Agents
      • Hidemium AI
    • Mouse
      • Click
      • Press and hold
      • Mouse movement
      • Scroll
      • Drop-down selector
      • Mouse wheel
    • Keyboard
      • Press key
      • Type text
      • Send text to selector
    • Data
      • Element exists
      • Get URL
      • Get text
      • Get value
      • Get attribute value
      • Random
      • File upload
      • File choose event
      • Read file
      • Write file
      • HTTP
      • Set variable
      • Authenticator Code
      • Converting JSON
      • Download file
      • Extraction In Text
      • Set cookies
      • Get cookies
      • Clear cookies
      • Image Search
      • Set Data
      • Get Data
      • Spreadsheet
      • Spreadsheet V2
      • WriteSheet
      • Set user agent
      • Delete file
      • IMAP(Read mail)
    • Other
      • Pause
      • If
      • Eval
      • While
      • For
      • Add comment
      • Update profile
      • Stop loop
      • Add log
      • Run other script
      • Disconnection
      • Open Extension
      • Run command
    • Scripts
      • Robot cookie
      • Upload nhiều ảnh
      • Register Etsy
    • How to start script auto ?
  • HIDEMIUM 从 A 到 Z 的指南
  • HIDEMIUM 的功能
    • 新资料
      • 主要
      • 代理
      • COOKIES
      • 硬件
      • 字体
      • 书签
      • 扩展
      • 自动填充
      • 其他配置
    • 账号
      • 导出所有数据
      • 多个更新
      • 快速创建
      • 更改代理
      • 自动化
    • 文件夹
    • 代理
  • API自动化
    • 远程资料
      • 1.打开资料
      • 2. Close profile
      • 3. 检查
    • 获取账号资料
      • 1. 资料列表
      • 2. 配置默认值列表
      • 3. 状态列表
      • 4. 标签列表
      • 5. 版本列表
      • 6.获取uuid的资料
      • 7. 获取文件夹列表
    • 互动资料
      • 1.默认创建资料
      • 2. 创建自定义资料
      • 3. 修改指纹
      • 4. 更新备注
      • 5. 更新名称
      • 6.同步标签
      • 7.修改状态
      • 8.删除资料
    • 代理
      • 1. 更新代理
      • 2. 更新资料的代理
    • 自动化
      • 脚本列表
  • 自动化用户手册
    • 调向器
      • 新标签页 (New tab)
      • 活动标签页 (Active tab)
      • 关闭标签页 (Close tab)
      • 打开 URL (Open URL)
      • 重新加载页面 (Reload page)
      • 截图 (Screenshot)
      • 切换框架 (Switch frame)
      • 切换扩展弹出窗口 (Switch Extension popup)
      • 返回 (Go back)
    • 鼠标
      • 单击 (Click)
      • 鼠标移动 (Mouse moverment)
      • 滚动 (Scroll)
      • 下拉选择 (Drop-down selector)
      • 鼠标滚轮 (Mouse wheel)
    • 键盘
      • 按键 (Press key)
      • 输入文字 (Type text)
      • 将文本发送到选择器 (Send text to selector)
    • 数据 (Data)
      • 元素存在 (Element exists)
      • 获取 URL (Get URL)
      • 获取文本 (Get text)
      • 获取值 (Get value)
      • 获取属性值 (Get attribute value)
      • 随机 (Random)
      • 文件上传 (File upload)
      • 文件选择事件 (File choose event)
      • 读取文件 (Read file)
      • 写入文件 (Write file)
      • HTTP
      • 设置变量 (Set variable)
      • 验证代码 (Authenticator Code)
      • 转换 JSON (Converting JSON)
      • 下载文件 (Download file)
      • 文本提取 (Extraction in text)
      • 设置 cookie (Set cookies)
      • 获取 cookies (Get cookies)
      • 清除Cookies (Clear cookies)
      • 图像搜索 (Image Search)
      • 设置数据 (Set Data)
      • 获取数据 (Get Data)
      • 电子表格 (Spreadsheet)
      • 电子表格 V2 (Spreadsheet V2)
      • 书写表 (WriteSheet)
      • 设置用户代理 (Set user agent)
      • 删除文件 (Delete file)
      • IMAP(阅读邮件) (Read mail)
    • 其他 (Other)
      • 暂停 (Pause)
      • 如果 (If)
      • 评估 (Eval)
      • while
      • For
      • 添加评论 (Add comment)
      • 更新账号资料 (Update profile)
      • 停止循环 (Stop loop)
      • 添加日志 (Add log)
      • 运行其他脚本 (Run other script)
      • 断开 (Disconnection)
      • 打开扩展 (Open Extension)
      • 运行命令 (Run command)
    • 脚本 (Scripts)
      • Cookie 机器人 (Robot cookie)
      • 上传多张照片 (Upload multiple photos)
      • 注册 Etsy (Register Etsy)
  • Hướng dẫn cài đặt Hidemium4 trên macOS
  • HIDEMIUM 4
    • I. Bắt đầu với Hidemium
      • Hướng dẫn cơ bản dùng Hidemium Version 4
        • Lesson 1: Giới thiệu về Hidemium
        • Lesson 2: Tải và cài đặt Hidemium
        • Lesson 3: Đăng ký và Đăng nhập Hidemium
        • Lesson 4: Tạo profiles Newbie với Hidemium
        • Lesson 5: Tạo profiles Expert với Hidemium
        • Lesson 6: Tạo Profiles bằng Quick Config Hidemium
        • Lesson 7: Sử dụng Folder quản lý Profiles
        • Lesson 8: Thêm Extension vào Profiles
        • Lesson 9: Transfer Profiles
        • Lesson 10: Bookmark
        • Lesson 11: Recycle
        • Lesson 12: Proxy Manager
        • Lesson 13: Synchronize
        • Lesson 14: Automation
        • Lesson 15: Tùy Chỉnh Ứng Dụng: Hướng Dẫn App Setting Cho Newbie
      • 🤖API AUTOMATION V4
        • Remote profile
          • 1. Open profile
          • 2. Close profile
          • 3. Checking
        • Get profile
          • 1. List profile
          • 2. List config default
          • 3. List status
          • 4. List tag
          • 5. List version
          • 6. Get profile by uuid
          • 7. Get list folder
        • Interact profile
          • 1. Create profile by default
          • 2. Create profile customize
          • 3. Change fingerprint
          • 4. Update note
          • 5. Update name
          • 6. Sync tags
          • 7. Change status
          • 8. Delete profile
        • Proxy
          • 1. Update proxy
          • 2. update profile's proxy
        • Automation
          • List scripts
        • Campaign
          • Get campaign
          • Create Schedule
          • Get Schedule
          • Update schedule status
          • Delete schedule
          • Create campaign
          • Add profile to campaign
          • Update campaign input variable
          • Delete campaign
          • Delete All Profile In Campaign
        • Get user uuid
      • Hướng dẫn cài đặt Hidemium4 trên macOS
    • II. Thiết lập và cấu hình hệ thống
      • Hướng dẫn sử dụng chức năng Synchronize
      • Hướng dẫn sử dụng chức năng backup profiles local
      • Khắc phục lỗi Start profiles không hiện
      • Hướng dẫn chuyển data profiles local sang ổ khác
      • Backup profile local trong trường hợp cần cài lại win hoặc cần chuyển profile sang một máy tính khác
      • Hướng dẫn đồng bộ data extension trên Hidemium
    • III. Quản lý tài khoản & config
      • Hướng dẫn tạo tài khoản member và phân quyền cho tài khoản member
      • Hướng dẫn mua và sử dụng config trong Hidemium store
    • IV. Tự động hóa (Automation & AI)
      • AUTOMATION FOUNDATION – Automation cơ bản
        • Navigator
          • New tab
          • Active tab
          • Close tab
          • Open url
          • Reload page
          • Screenshot
          • Switch Frame
          • Switch Extension popup
          • Go back
        • AI Agents
          • Hidemium AI
        • Finger Action
          • Tap
          • Touch Move
        • Mouse
          • Click
          • Press and hold
          • Mouse movement
          • Scroll
          • Drop-down selector
          • Mouse wheel
        • Keyboard
          • Press key
          • Type text
          • Send text to selector
        • Data
          • Element exists
          • Element exists V2
          • Get URL
          • Get text
          • Get value
          • Get attribute value
          • Random
          • File upload
          • File choose event
          • Read file
          • Write file
          • HTTP
          • Set variable
          • Authenticator Code
          • Converting JSON
          • Download file
          • Extraction In Text
          • Set cookies
          • Get cookies
          • Clear cookies
          • Image Search
          • Image Search V2
          • Set Data
          • Get Data
          • Spreadsheet
          • Spreadsheet V2
          • WriteSheet
          • Set user agent
          • Delete file
          • IMAP(Read mail)
          • Outlook Mailer (oAuth2)
        • Other
          • Pause
          • If
          • Eval
          • While
          • For
          • Add comment
          • Update profile
          • Stop loop
          • Add log
          • Run other script
          • Disconnection
          • Open Extension
          • Run command
          • Handle Dialog
      • AUTOMATION ADVANCE
        • CÁCH ĐỂ SỬ DỤNG X THỎA MÃN 2 ĐIỀU KIỆN HOẶC THỎA MÃN MỘT TRONG NHIỀU ĐIỀU KIỆN BẰNG AUTOMATION
        • CÁCH GET TEXT RỒI GROUP TOÀN BỘ TEXT VÀ LẠI TÁCH TỪNG TEXT RA BẰNG AUTOMATION
        • Cách quản lý data ( dữ liệu ) theo file excel khi chạy automation.
        • COPY NHƯNG PASTE RA MỚI XUẤT HIỆN TEXT ?
        • SỬ DỤNG SCROLL TRONG TRANG CÓ NHIỀU THANH CUỘN
        • PHÂN BIỆT DÙNG DROP DOWN SELECTOR.
        • SỬ LÝ POPUP XUẤT HIỆN LIỀN NHAU
      • CÁCH TẠO CAMPAIGN AUTOMATION
      • Hướng dẫn sử dụng Custom node trong automation
    • V. Tài liệu nâng cao & nghiên cứu
      • Vì sao CreepJS thường chỉ hiện RAM 4GB hoặc 8GB trong fingerprint?
      • Tin tức và bài viết về Antidetect
        • Nguyên lý hoạt động Ports to protect của hidemium?
        • Cơ chế phát hiện người hoặc robot
        • Kiến thức về TCP/IP browser fingerprint
        • Kiến thức về Kỹ thuật NojsFingerprint
        • Kiến thức về Kỹ thuật TLS Fingerprint
        • Giới thiệu về chức năng QUIC Protocol trên Hidemium
        • Hệ thống phát hiện bạn dùng Proxy khi nào?
        • Mobile Proxies và Residential Proxies cái nào tốt hơn?
Powered by GitBook
On this page
  1. HIDEMIUM 4
  2. V. Tài liệu nâng cao & nghiên cứu
  3. Tin tức và bài viết về Antidetect

Cơ chế phát hiện người hoặc robot

PreviousNguyên lý hoạt động Ports to protect của hidemium?NextKiến thức về TCP/IP browser fingerprint

Last updated 3 days ago

Theo lập trường cá nhân, hiện nay cuộc chiến giữa người và bot AI đang diễn ra hằng ngày đòi hỏi các hệ thống càng ngày càng detected chặt chẽ hơn, càng khó, càng phải chi tiết hơn trước. Chính vì thế chúng ta cần phải hiểu nguyên nhân gốc rễ vấn đề để tự mình nâng cao tầm hiểu biết, nâng cao chính bộ máy công nghệ của mình lên. Sau đây mình xin trình bày 1 số khái niệm check bot cơ bản có thể các bạn đã biết, bạn nào chưa biết thì xin 1 like!!

Với Bot dựa trên web , tôi đề cập đến các bot giao tiếp chủ yếu qua giao thức HTTP và HTTPS bao gồm request http trong ngôn ngữ lập trình hoặc request trong trình duyệt thực tế ta có thể nhìn thấy được. Ở đây, tôi sẽ chỉ xem xét các bot có nghĩa là Good Bot hoặc bot Human. Nói cách khác, các Good Bot tận dụng các trình duyệt thực bằng cách sử dụng một số dạng tự động hóa trình duyệt như Playwright, Puppeteer, Selenium, PhantomJS và nhiều loại khác.

Các lập trình viên tạo Bot dựa trên web vì vô số lý do kinh tế khác nhau:

  • Tự động hóa các công việc liên tục để tiết kiệm sức lao động của con người

  • Cào thông tin có giá trị từ các trang web (Công cụ tìm kiếm, Amazon, eBay, YouTube, …)

Hoặc những ứng dụng:

  • Tự động tạo nội dung trên các nền tảng truyền thông xã hội (Twitter, TikTok, Instagram Bots)…

  • Thực hiện auto click ads…

  • Mạo danh Người dùng khác…

Để không bị phát hiện và đánh dấu là bot xấu, anh em cần giả lập hành vi, thông số gần gũi nhất với con người thật. Ở đây tôi sẽ trình bày một số khía cạnh mà các hệ thống cơ bản sẽ phát hiện:

1. Lấy dấu vân tay của trình duyệt Dấu vân tay của trình duyệt là cấu hình kỹ thuật của trình duyệt cho phép trang web nhận dạng và phân biệt người dùng truy cập.

Trình duyệt cung cấp rất nhiều thông tin cho các trang web mà chúng truy cập. Ví dụ: window.navigator trưng bày nhiều thông tin khác nhau cho phép lấy dấu vân tay của trình duyệt và tìm hiểu thêm về useragent của trình duyệt

  1. Làm nhiễu càng chuẩn thông tin càng tốt. Cái nào không giả lập được giống thật thì tốt nhất nên tắt đi. (Ví dụ như canvas). Vậy nên hiện nay trên thị trường rất ít bên có thể fake được các nền tảng khác nhau mà pass xanh được tất cả các hệ thống check (Pixelscan, browserscan, browserleaks, creepjs …).

  2. Nên dùng trên 1 thiết bị tránh làm thay đổi fingerprint, vì khi làm nhiễu thông tin thì con số làm nhiễu đó sẽ chỉ tồn tại trên máy đó. Khi mở ở máy khác thì số nhiễu đó sẽ bị chuyển đổi sang số khác nên cũng sẽ gây rủi do cho người dùng.

Các thông số lấy dấu vân tay của trình duyệt tốt nhất không nên thay đổi trong quá trình sử dụng, ví dụ:

  • Múi giờ ( "Europe/Berlin" ) trình duyệt của bạn được định cấu hình trong:window.Intl.DateTimeFormat().resolvedOptions().timeZone

  • Nền tảng ( "Linux x86_64" ) mà trình duyệt của bạn đang chạy:navigator.platform

  • Sự tương tranh phần cứng ( 4 ) của trình duyệt:navigator.hardwareConcurrency

  • Độ phân giải màn hình của bạn ( [1920, 1080] ):[window.screen.width, window.screen.height]

  • Dung lượng bộ nhớ ( 4 ) mà thiết bị của bạn có:navigator.deviceMemory

  • Codec âm thanh/video nào trình duyệt của bạn hỗ trợ

  • Trình duyệt có kích hoạt màn hình cảm ứng hay không

  • Và nhiều cái khác …

Dấu vân tay của trình duyệt có liên quan như thế nào đến good bot? Người tạo bot cố gắng giả mạo dấu vân tay duyệt web càng chung chung càng tốt. Chiến lược chính của họ là ẩn mình dưới radar và ngụy trang thành một khách truy cập có dấu vân tay duyệt web thông thường.

Một điểm quan trọng khác đối với người tạo bot là không nói dối khi giả mạo dấu vân tay của họ : Ví dụ: đặt Useragent iPhone nhưng không điều chỉnh Useragent cho phù hợp navigator.userAgent hoặc navigator.appVersion sẽ khiến các công ty chống bot phát hiện ra rằng trình duyệt có khả năng bị giả mạo.

Với Adspowser IO

Một lỗi rất phổ biến khác mà tôi thường thấy: Lập trình viên bot fake Useragent của họ trong tiêu đề HTTP nhưng lại quên làm như vậy trong thuộc navigator tính (Chủ yếu là navigator.userAgent và navigator.appVersion ).

2. Các khía cạnh mạn

Các Good Bot dùng proxy dân cư hoặc di động để thay đổi địa chỉ IP của chúng. Lý do tại sao họ làm điều này rất đơn giản: Hầu hết các trang web đều sử dụng giới hạn tốc độ dựa trên IP. Nói cách khác: Khi bot của bạn xử lý hàng nghìn trang trong một khoảng thời gian ngắn, bot có thể bị chặn nhanh chóng do mỗi yêu cầu đều xuất phát từ cùng một địa chỉ IP. Khi bạn mua proxy share dùng chung nhiều người, tốc độ proxy của bạn cũng sẽ không được tốt và tốc độ load trang cũng sẽ bị ảnh hưởng.

Địa chỉ IP di động có uy tín cao nhất. Hầu như không thể chặn lưu lượng truy cập bắt nguồn từ địa chỉ IP di động vì nhiều người dùng khác nhau trong cùng một khu vực di động chia sẻ cùng một địa chỉ IP trong mạng 4G.

Tại sao điều này lại liên quan đến việc phát hiện bot?

Lý do rất rõ ràng: Nhiều lập trình viên bot đang sử dụng dịch vụ proxy thương mại để chuyển đổi và ẩn địa chỉ IP thực của họ. Tuy nhiên, khi bạn định cấu hình dấu vân tay trình duyệt của mình trông giống iPhone nhưng chữ ký gói TCP SYN trông giống như thuộc về hệ điều hành Linux, chỉ có hai cách giải thích hợp lý cho điều đó:

  1. Lưu lượng truy cập đến từ người dùng iPhone hợp pháp sử dụng VPN/Proxy

  2. Một lập trình viên bot độc hại đã quên giả mạo dấu vân tay TCP/IP của họ (hay chính xác hơn: máy chủ proxy ở giữa)

Phát hiện bot bằng dấu vân tay TCP/IP thụ động là một kỹ thuật có khả năng dẫn đến nhiều kết quả không chính xác. Do đó, nó có thể được sử dụng theo cách khác như:

Vào một ngày bình thường, 5% khách truy cập của tôi sử dụng VPN/Proxy. Nhưng sau hai giờ, 40% người dùng của tôi đột nhiên xuất hiện một số loại dấu vân tay TCP/IP mới. Hãy chặn lưu lượng truy cập đó một lúc và xem có ai phàn nàn không;)

3. Automation

Ngay lập tức, Hệ thống automation web đó được cung cấp cùng với các tệp nhị phân của trình duyệt được biên dịch sẵn. Những tệp nhị phân đó thường được cấu hình hơi khác so với các tệp nhị phân của trình duyệt thông thường.

Tuy nhiên, người dùng thực sự remote trình duyệt của họ khá khác so với hành vi do sử dụng API của người remote automation. Ví dụ: người thực sự không đợi một số sự kiện nhất định xảy ra trước khi di chuyển chuột của mình (chẳng hạn như sự kiện networkidle2 ).

4. Cơ sở hạ tầng lưu trữ

Các Good Bot cần được lưu trữ ở đâu đó. Chỉ các hoạt động bot quy mô nhỏ mới có thể được chạy từ máy tính cá nhân của các lập trình viên. Do đó, các bot dựa trên web thường được lưu trữ từ bên trong cơ sở hạ tầng đám mây.

Tuy nhiên, con người thực sự duyệt web từ máy tính cá nhân và điện thoại thông minh của họ. Với sự trợ giúp của JavaScript, thường có thể xác định loại môi trường máy tính nơi mã JavaScript được thực thi.

  • 5900: VNC

  • 5901: VNC port 2

  • 5902: VNC port 3

  • 5903: VNC port 4

  • 5279:

  • 3389: Windows remote desktop / RDP

  • 5931: Ammy Admin remote desktop

  • 5939:

  • 5944:

  • 5950: WinVNC

  • 6039: X window system

  • 6040: X window system

  • 63333: TrippLite power alert UPS

  • 7070: RealAudio

5. Lấy dấu vân tay hành vi

Phương pháp phát hiện tốt nhất và khó nhất được đưa ra cuối cùng: Kỹ thuật phát hiện dựa trên hành vi. Hành vi con người thì rất là khó đoán nhưng nó cũng sẽ tuân theo một số rule cơ bản, Con người di chuyển chuột, bàn phím, màn hình cảm ứng và con lăn theo kiểu tự nhiên. Bot vẫn gặp khó khăn trong việc bắt chước chuyển động của chuột và thao tác chạm trên màn hình cảm ứng như người thật. Một số sự kiện JavaScript được quan tâm ở đây: mousedown , mousemove , touchstart , touchmove , keydown , …

Một quy trình đơn giản để phân biệt bot với người thật dựa trên dữ liệu hành vi có thể như sau:

  1. Bước đầu tiên là thu thập hành vi của bạn.

  2. Bước tiếp theo (và khó hơn) là phân loại tập dữ liệu giống con người hoặc giống bot (từ dữ liệu database đã có từ trước đó).

  3. Bạn nên có một kiến thức về hành vi thao tác để viết ra bot automation phù hợp, thời gian click năn chuột sao cho giống người thật nhất có thể.

Nhưng chính xác thì điều gì tạo nên sự tương tác giữa chuột hoặc sự kiện chạm trong trình duyệt với con người ? Các tính năng cực kỳ khó mô phỏng một cách máy móc là gì? Một số ý tưởng sơ bộ (thay thế chuột bằng các sự kiện chạm trong trường hợp thiết bị di động):

  • Con chuột được sử dụng để hỗ trợ việc đọc ( bạn hãy tự quan sát ), lúc đọc văn bản chuột bạn thường để đâu và làm gì?

  • Tốc độ bắt đầu và dừng chuột giữa các điểm ưa thích

  • Quỹ đạo di chuyển của chuột

  • Phân bố các sự kiện theo thời gian. Con người nhìn vào màn hình, xử lý thông tin một cách trực quan và phản ứng vật lý. Mô hình này lặp đi lặp lại mọi lúc. Độ trễ trong các kiểu phản ứng như vậy về bản chất là do con người.

  • Khoảng thời gian giữa các lần click chuột

  • Chuột đi theo điểm lấy nét của mắt

  • Tốc độ cuộn tương quan với thời gian đọc

  • Dữ liệu hành vi tăng đột biến khi một trang web yêu cầu tương tác

  • Chuột di chuyển lên trên cùng (tab) khi điều hướng đi (không phải trên thiết bị di động)

  • Chỉ dành cho thiết bị di động: đôi khi kích thước màn hình giảm mạnh 180 độ khi tự động xoay

  • Khi không quan tâm, chuột chạy rất nhanh đến nút “đóng tab”

  • Các lĩnh vực quan tâm trong văn bản được đánh dấu

  • …?

Hiện nay tồn tại các thư viện JavaScript check fingerprint được sử dụng rộng rãi như , với mục đích duy nhất là thu thập càng nhiều biến cấu hình trình duyệt và đánh giá mức độ rủi do. Để có được dấu vân tay trình duyệt ổn định là một vấn đề chúng ta cần tối ưu:

Với Iphone

Hơn nữa, các loại Địa chỉ IP khác nhau có ISP khác nhau trên Internet. Ví dụ: các địa chỉ IP của Datacenter như địa chỉ IP của hoặc có mức độ trust khá thấp khi nói đến lưu lượng truy cập web. Lý do rất rõ ràng: Quản trị viên web không thích lưu lượng truy cập bắt nguồn từ ISP Datacenter vì khả năng lớn đó là lưu lượng truy cập tự động. Người dùng bình thường định tuyến lưu lượng truy cập thông qua các máy chủ đám mây như thế nào?

Giải thích của các chuyên gia từ :

Proxy di động 4G/LTE mạnh đến mức chúng khiến các lệnh cấm IP truyền thống hoàn toàn vô dụng, điều này là nhờ vào công nghệ mới được các nhà cung cấp dịch vụ di động có tên là CGNAT sử dụng. Dịch địa chỉ mạng cấp nhà cung cấp dịch vụ là một khái niệm rất đơn giản, có nghĩa là IP hiện tại của bạn đang được chia sẻ bởi hàng trăm, nếu không muốn nói là hàng nghìn người thực. Các trang web biết rất rõ điều này và họ biết nếu họ cấm một IP duy nhất, họ có thể cấm hàng trăm người dùng thực. (Nguồn: )

– Fingerprint TCP/IP Một khía cạnh khác ít được biết đến hơn khi phát hiện bot là dấu vân tay TCP/IP. Bởi vì nhiều hệ điều hành có một dấu vân tay TCP/IP duy nhất (ví dụ: window size và MTU khác nhau giữa các hệ điều hành), nên có thể đưa ra phỏng đoán rất chính xác về hệ điều hành của máy chủ đang giao tiếp với máy chủ chỉ dựa trên dữ liệu đến đầu tiên. Gói TCP SYN. có lẽ là công cụ lấy dấu vân tay TCP/IP thụ động được sử dụng nhiều nhất hiện nay.

Để tham khảo rõ hơn mời bạn đọc bài

Các Good bot thường dựa trên hoặc . Hệ thống automation đó sử dụng , cho phép tự động hóa và kiểm soát các trình duyệt theo chương trình. Điều này có nghĩa là bạn có thể kiểm soát toàn bộ chức năng của trình duyệt bằng .

Có các plugin Node.js dành cho người remote automation, khắc phục .

Hơn nữa, vì các chương trình remote automation thường giao tiếp qua giao thức Web Socket nên có một độ trễ nhỏ giữa việc thực hiện các lệnh (hoặc độ trễ lớn hơn khi sử dụng ).

Thông thường, các hệ thống remote automation đó cho việc tạo các chuyển động chuột hoặc sự kiện click thực tế.

Bởi vì các lập trình viên bot muốn lưu trữ bot của họ một cách tiết kiệm nên họ phân bổ ít tài nguyên CPU/Bộ nhớ khi cần thiết . Điều này hoàn toàn trái ngược với người dùng bình thường sử dụng máy tính xách tay có bộ nhớ 16GB để truy cập các trang web đơn giản. Đây có thể là một phương pháp phỏng đoán khác có thể được sử dụng để đưa ra phỏng đoán có căn cứ xem Useragent có phải là bot hay không. hỗ trợ anh em giả lập memory, ổ đĩa ổ cứng tăng lên so với các bên không hỗ trợ fake ổ cứng ổ đĩa

Trình duyệt cũng có thể làm rò rỉ thông tin về GPU và CPU của máy tính. Một thử nghiệm đơn giản là đo thời gian cần thiết để . Các thử nghiệm khác đo độ trễ giữa CPU và GPU. Trên hạ tầng cloud giá rẻ thường chỉ hỗ trợ GPU ảo nên độ trễ sẽ lớn hơn.

Một số VPS đám mây thường mở một số cổng mặc định nhất định. Có thể lấy dấu vân tay của các cổng đang mở vì . Do đó, một trang web có thể quét cổng mạng cục bộ của hệ điều hành bot của bạn và nếu nó giống như một VPS, hãy chặn bạn. Vì vậy tôi khuyên bạn nên chặn tất cả các cổng mà VPS có thể mở

có chức năng block port, Nếu bạn nào chạy trên VPS hãy dùng nó block các cổng cơ bản trên VPS

Có một số công ty như và đã sử dụng phương pháp này từ nhiều năm nay.

Bài viết được dịch từ tác giả incolumitas Để miễn phí trải nhiệm hidemium mời bạn tải tại: Mua gói hidemium để trải nhiệm automation tại:

vân tay
Hidemium
Amazon AWS
Google Cloud Functions
proxyize.com
proxyize.com/full-guide/
p0f3
TCP/IP Fingerprint là gì
kịch bản automation puppeteer
kịch bản automation playwright
Giao thức DevTools
API cấp cao
tình trạng detect automation
Giao thức DevTools từ xa
không hỗ trợ tốt
Hidemium
hiển thị khối WebGL
có thể quét cổng mạng bằng JavaScript trong trình duyệt
Bạn có thể tham khảo tại đây
Hidemium
biocatch
perimeterx
Download
Pricing
phần tiên tiến