Scraping-ul web sau scraping-ul de date este procesul de extragere și colectare a datelor de pe site-urile web. În ziua de astăzi, colectarea datelor se face în mare parte automat, prin utilizarea de instrumente specifice. La scară mai mică, utilizatorii obișnuiți de internet participă adesea la procesul de scraping de date. Acest proces manual presupune ca utilizatorii să copieze și să lipească informațiile într-un document sau fișier stocat local.
În principal, companiile utilizează tehnica de extragere automată de date web. Aceasta reprezintă o metodă eficientă de a colecta milioane sau chiar miliarde de unități de date pentru adunarea de informații, cercetarea de marketing, generarea de potențiali clienți și comparația prețurilor.
Latura întunecată a tehnicii de scraping web
Riscurile de securitate asociate acestei tehnici sunt infinite, deoarece infractorii profită de pe urma procesului de colectare a datelor publice. Două exemple recente care ilustrează modul în care scraping-ul de date a dus la compromiterea confidențialității utilizatorilor sunt scurgerile de date de pe platformele Facebook și LinkedIn. Ambele incidente au fost asociate cu scraping-ul de date, ducând la expunerea a peste un miliard de puncte de accesare a informațiilor de pe profilurile utilizatorilor.
Riscurile asociate expunerii datelor și confidențialității utilizatorilor se pot extinde în diferite moduri, deoarece infractorii pot dezvolta instrumente de scraping web cu mai multe funcții reprobabile pentru a evita sistemele de securitate ale site-urilor web țintă, colectând mai multe informații cu caracter sensibil de la utilizatorii platformelor.
Platformele de socializare sunt predispuse scraping-ului ilegal de date din cauza volumului mare de informații cu caracter personal (PII) pe care utilizatorii le partajează în mod regulat. Infractorii exploatează rapid comportamentul neglijent de pe rețelele de socializare, colectând datele cu caracter personal de pe profilurile utilizatorilor. Aceste informații includ nume complete, date de naștere, locații, adrese de e-mail, numere de telefon, locuri de muncă, fotografii și orice alte date pe care utilizatorii pe publică pe platformă.
Aceste informații sunt deosebit de importante pentru infractori, care le utilizează pentru a lansa atacuri de phishing prin e-mail, mesaje sau aplicații de mesagerie instantanee. În plus, infractorii cibernetici pot utiliza datele colectate despre locul de muncă pentru a viza anumiți angajați și a compromite rețelele interne folosind ransomware de compromitere.
Riscurile suplimentare de securitate derivă din bazele de date configurate necorespunzător sau neprotejate, care conțin date publice despre utilizatori. În ultimii ani, miliarde de seturi de date despre utilizatori au fost accesate de entități neautorizate, ducând astfel la creșterea numărului de victime ale breșelor de securitate a datelor și la sporirea activităților infracționale din spațiul cibernetic.
Cum pot utilizatorii obișnuiți de internet să se protejeze împotriva incidentelor bazate pe scraping de date?
Deși unele platforme online tolerează scraping-ul datelor utilizatorilor lor, protejarea împotriva acestor practici este un proces complex. Existența unor lacune permite infractorilor să filtreze și să extragă informațiile private ale utilizatorilor. Unul dintre cele mai bune moduri prin care utilizatorii se pot proteja împotriva expunerii nedorite a datelor din cauza colectării acestora de pe internet este limitarea informațiilor pe care aceștia le furnizează atunci când își creează un cont sau un profil.
Deciziile inteligente, orientate către confidențialitate, de a filtra datele pe care utilizatorii rețelelor de socializare le publică, pot constitui o măsură foarte eficientă. Poate că această soluție nu este imbatabilă, însă reducerea cantității de informații publice, care pot fi combinate și utilizate pentru lansarea atacurilor targetate, poate scăpa utilizatorii de eventuale pagube. Dacă nu ți-ai revizuit setările de confidențialitate ale contului de când te-ai înregistrat pe o anumită platformă, ar fi cazul să o faci. Începe prin a nu permite niciunui utilizator de internet să îți vadă adresa de e-mail, numărul de telefon sau data de naștere.
tags
The meaning of Bitdefender’s mascot, the Dacian Draco, a symbol that depicts a mythical animal with a wolf’s head and a dragon’s body, is “to watch” and to “guard with a sharp eye.”
Toate articolele