Læs artikler bag paywalls ved at masquerading som Googlebot

Prøv Vores Instrument Til At Fjerne Problemer

Internettet er på et tippunkt. Den fortsatte stigning i adblocking har bragt en stopper for indtægtsmodellen, der udelukkende er afhængig af annonce dollars til at drive websteder og virksomheder.

Især nyhedswebsteder er begyndt at eksperimentere med måder at diversificere indkomstkilder på, og en fremtrædende mulighed, som websteder som The Wall Street Journal, Financial Times, The New York Times, tiderne , eller Washington Post har implementeret eller testet er paywall-systemet.

Der er forskellige typer af betalingsvægge, men de har alle til fælles, at de blokerer adgangen til indhold; dette kan ske direkte, når den første artikel åbnes, efter at et vist antal artikler er blevet læst på webstedet, eller som et uddragssystem, der viser det første afsnit til læseren og under denne tilmeldingsinformation for at læse resten.

Paywalls kræver ikke altid, at brugerne betaler penge for adgang. Nogle steder kræver muligvis, at brugere tilmelder sig for at bruge webstedet, men oplader ikke brugere, når de har tilmeldt sig.

news site paywall

Det kan være fornuftigt ud fra et forretningsmæssigt synspunkt og kan være mere lukrativt end at kæmpe for det med brugere, der kører adblockere, men der er en ulempe med det både for det betalingsmæssige websted og den blokerede bruger.

Websteder mister en høj procentdel af besøgende, hvis de implementerer et paywall-system. Det er uklart, hvor høj procentdel virkelig er, og den varierer sandsynligvis fra sted til sted, men det er sandsynligvis meget højere end procentdelen af ​​besøgende, der abonnerer på webstedet efter at have fået valget om at abonnere for at læse den ønskede artikel.

For brugere kan det være virkelig frustrerende at følge et link til en interessant, klingende artikel bare for at blive blokeret fra at læse den, når ressourcen er indlæst; det er spild af tid for mange, især hvis der ikke findes noget indhold inden tilmelding eller abonnement.

Maskerer din browser

Det er ingen hemmelighed, at nyhedswebsteder giver adgang til nyhedsaggregatorer og søgemaskiner. Hvis du f.eks. Tjekker Google Nyheder eller Søgning, finder du artikler fra websteder med betalingsvægge, der er anført der.

Tidligere har nyhedswebsteder tilladt adgang til besøgende fra større nyhedsaggregatorer som Reddit, Digg eller Slashdot, men denne praksis ser ud til at være så god som død i dag. Nogle tillader det muligvis stadig, men det er prøve og fejl, og løsningen kan til enhver tid lukkes.

Et andet trick, at indsætte artikeltitlen i en søgemaskine for at læse den cachelagrede historie på den direkte, ser ikke ud til at fungere ordentligt, ligesom artikler på websteder med betalingsvægge normalt ikke cache-cache længere.

Tip: Tjek følgende tilføjelse, som du muligvis kan bruge til at omgå betalingsvægge:

Bruger agent og henviser

Du undrer dig sandsynligvis over, hvordan websteder blokerer for eller tillader adgang til webstedets indhold. Metoderne er forbedret i årenes løb, og det er ikke længere nok blot at ændre browserens henvisning til https://www.google.com/ for at få fuld adgang til et websteds indhold.

I stedet bruger websteder forskellige kontroller, der inkluderer brugeragent, henviser og cookies, og nogle gange endda mere end det, for at bestemme legitimiteten af ​​adgangen.

Generel information

Den bedste måde at maskerer browseren på er sandsynligvis at få det til at være Googlebot.

  • Henviser: https://www.google.com/
  • Brugeragent: Mozilla / 5.0 (kompatibel; Googlebot / 2.1; + http: //www.google.com/bot.html

Bemærk, at indstillingen ikke fungerer mere på maj-sider. Det kan være bedre at prøve at maskere sig som kommer fra Twitter eller andre sociale mediesider.

Firefox

referrer

Firefox-brugere har brug for to browser-tilføjelser til det: den første, RefControl, for at ændre henvisningsværdien, når de besøger nyhedswebsteder, den anden, Bruger Agent Switcher , for at ændre browseragentets brugeragent.

Opdatering : RefControl er ikke længere tilgængelig. Du kan Prøv dette alternativ i stedet. Ende

  1. Download og installer begge udvidelser i Firefox webbrowser.
  2. Tryk på Alt-tasten, og vælg Værktøjer> RefControl-indstillinger.
  3. Klik på 'tilføj side', indtast et domænenavn under webstedet, vælg tilpasset handling, og indtast https://www.google.com/ som henviseren.
  4. Gentag dette for alle nyhedswebsteder, du vil have adgang til (nogle fungerer muligvis ikke, selvom du foretager ændringerne, så husk det).
  5. Når du er færdig, skal du lukke konfigurationsvinduet.
  6. Tryk på Alt-tasten igen, og vælg Værktøjer> Standardbrugeragent> Rediger brugeragenter fra menuen.
  7. Vælg Ny> Brugeragent, og erstat strengen i feltet Brugeragent med Mozilla / 5.0 (kompatibel; Googlebot / 2.1; + http: //www.google.com/bot.html). Navngiv det Googlebot.
  8. Gå ud af menuen.
  9. Før du åbner disse sider, skal du trykke på Alt og vælge Standardbrugeragent> Googlebot.

Det er alt, hvad der er dertil. Det er lidt uheldig, at der ikke er nogen udvidelse til Firefox, der automatisk ændrer brugeragenten baseret på de websteder, du besøger.

Google Chrome

Google Chrome-brugere kan installere udvidelser som Bruger Agent Switcher og Henvisningskontrol der er tilgængelige for browseren til at gøre det samme.

Der er dog en anden mulighed, og det er at oprette en brugerdefineret udvidelse, der automatiserer processen i browseren.

Instruktioner findes på Elaineou . Alt, hvad det kræver, er grundlæggende at oprette et nyt bibliotek på den lokale computer, oprette de to filer background.js og manifest.json deri, og kopiere og indsætte koden, der findes på webstedet, i filerne.

Du skal aktivere 'udviklertilstand' på chrome: // extensions /, og kan derefter vælge 'load unpacked extension' for at vælge den mappe, du har oprettet, de to filer i for at indlæse udvidelsen i Chrome.

Du kan ændre listen over sider, den understøtter for at tilføje nye.