L'esperto Semalt racconta come la raschiatura dei dati Web è stata legalizzata con una sentenza del tribunale

Mentre può essere illegale raccogliere dati da siti Web senza l'esplicita autorizzazione dei proprietari del sito, un giudice ha recentemente deciso diversamente in determinate circostanze. hiQ Labs ha recentemente intentato una causa contro LinkedIn per impedire loro di estrarre dati dalle pagine di LinkedIn.

Alla maggior parte delle persone è stato uno shock scortese che a LinkedIn è stato detto di dare alla startup un accesso gratuito alle sue pagine web. hiQ ha utilizzato i suoi algoritmi per rilevare quando un utente di LinkedIn è alla ricerca di un lavoro in base alle modifiche apportate al proprio profilo pubblico.

Gli algoritmi vengono eseguiti su dati estratti dalle pagine Web di LinkedIn. Come previsto, a LinkedIn non è piaciuto e sono state messe in atto contromisure per impedire a hiQ l'ulteriore estrazione dei dati. Oltre alle barriere tecniche introdotte, sono state emesse anche avvertenze legali fortemente espresse.

La startup non ha avuto altra scelta che affrontare il problema legalmente. hiQ ha dovuto cercare un ricorso legale. La società voleva che a LinkedIn fosse ordinato di rimuovere le sue barriere tecniche. hiQ voleva anche legalizzare il suo processo di estrazione dei dati su LinkedIn.

Fortunatamente per l'avvio, ha ottenuto quello che voleva. La sentenza era a favore di hiQ. A LinkedIn è stato ordinato di rimuovere tutte le contromisure che impediscono a hiQ di raschiare le sue pagine Web (LinkedIn) e di dare anche a mano libera hiQ poiché l'atto è totalmente legale. Il giudice ha dettato la sua decisione sul fatto che ciò che hiQ vuole raschiare sono i dati che sono stati mostrati al pubblico.

Il giudice non ha solo ordinato all'imputato di rimuovere tutti i meccanismi preventivi messi in atto contro l'HiQ, ma ha anche ordinato che l'imputato dovesse desistere da tali atti in futuro.

Promuovere dati web aperti

Mentre la sentenza è ancora un'ingiunzione temporanea, è commovente sentire che la legge supporta i dati web aperti e l'accesso gratuito alle informazioni su Internet come conferma questa sentenza. Anche se la decisione finale arriva a favorire l'imputato, questo fatto è già stato stabilito.

Il giudice ha promosso questa politica chiudendo praticamente tutti gli argomenti di LinkedIn. Mentre LinkedIn ha provato a dimostrare che l'attore stava violando la sua privacy, il giudice ha contrastato il fatto che anche l'imputato sta vendendo i dati.

Quando l'argomentazione non ha trattenuto l'acqua, l'imputato ha anche affermato che l'atto di hiQ era in grave violazione del Computer Fraud and Abuse Act (CFAA) perché l'avvio ha avuto accesso ai loro server per raccogliere dati illegalmente. Ancora una volta, l'argomento è stato bucato. È stato respinto per il fatto che hiQ stava solo raschiando contenuti su pagine pubbliche non protette.

Il giudice ha analizzato il caso come qualcuno che entra in un negozio aperto durante l'orario di lavoro. Non si può dire che una persona del genere sia trasgredire. Quindi, hiQ non è stato sconfinare. È interessante notare che il giudice è andato oltre per spiegare perché la sua sentenza è nell'interesse pubblico.

In breve, il tribunale ha ammesso che è nell'interesse pubblico consentire la scansione, l'estrazione e l'analisi dei dati. Pertanto, sarà una politica dannosa incoraggiare il posizionamento di ostacoli alla libera circolazione delle informazioni.

Cosa dovresti imparare dalla sentenza

Anche se potresti non avere motivi per estrarre i dati direttamente da LinkedIn, dovresti imparare dalla sentenza. È meglio giocare in sicurezza leggendo e rispettando il file robots.txt di tutti i siti Web. Ricorda, la sentenza è ancora un'ingiunzione temporanea. Alla fine potrebbe andare a favore di LinkedIn.

Mentre la sentenza potrebbe non influire direttamente su di te, è lieto che un tribunale federale confermi la politica di mantenere la rete aperta al pubblico. Pertanto, le informazioni dovrebbero essere disponibili e accessibili a coloro che possono cercarle e farne buon uso.

I dati Web sono estremamente utili a tutti, in particolare agli analisti dei media, agli sviluppatori, ai data scientist e ad altri professionisti. In quanto tale, la sentenza è uno sviluppo positivo.