Czytaj artykuły za paywallami, udając Googlebota
- Kategoria: Internet
Internet znajduje się w punkcie zwrotnym. Ciągły wzrost blokowania reklam położył kres modelowi przychodów, który opiera się wyłącznie na dolarach reklamowych do obsługi witryn internetowych i firm.
Zwłaszcza serwisy informacyjne zaczęły eksperymentować ze sposobami dywersyfikacji źródeł dochodu i jedną z głównych opcji, że witryny takie jak The Wall Street Journal, Financial Times, The New York Times, czasy , lub The Washington Post wdrożyły lub przetestowały system paywall.
Istnieją różne typy paywallów, ale łączy je to, że blokują dostęp do treści; może się to zdarzyć bezpośrednio po otwarciu pierwszego artykułu, po przeczytaniu określonej liczby artykułów na stronie lub jako system fragmentów, który wyświetla czytelnikowi pierwszy akapit, a poniżej informacje o rejestracji, aby przeczytać resztę.
Paywall nie zawsze może wymagać od użytkowników płacenia za dostęp. Niektóre witryny mogą wymagać od użytkowników zarejestrowania się w celu korzystania z witryny, ale nie będą obciążać użytkowników po dokonaniu rejestracji.
Może to mieć sens z biznesowego punktu widzenia i może być bardziej lukratywne niż walka z użytkownikami, którzy uruchamiają adblockery, ale ma to wady zarówno dla strony płatnej, jak i zablokowanego użytkownika.
Witryny tracą wysoki procent odwiedzających, jeśli wdrażają system paywall. Nie jest jasne, jak wysoki jest ten odsetek i prawdopodobnie różni się w zależności od witryny, ale prawdopodobnie jest dużo wyższy niż odsetek użytkowników, którzy zasubskrybowali witrynę po tym, jak otrzymali możliwość zasubskrybowania i przeczytania żądanego artykułu.
Dla użytkowników może być naprawdę frustrujące kliknięcie odsyłacza do interesująco brzmiącego artykułu tylko po to, aby uniemożliwić mu przeczytanie go po załadowaniu zasobu; dla wielu jest to strata czasu, zwłaszcza jeśli przed zarejestrowaniem się lub subskrybowaniem nie zostaną udostępnione żadne treści.
Zamaskuj swoją przeglądarkę
Nie jest tajemnicą, że serwisy informacyjne umożliwiają dostęp do agregatorów wiadomości i wyszukiwarek. Jeśli zaznaczysz na przykład Google News lub wyszukiwarkę, znajdziesz artykuły z witryn z wymienionymi tam paywallami.
W przeszłości serwisy informacyjne umożliwiały dostęp do odwiedzających pochodzących z głównych agregatorów wiadomości, takich jak Reddit, Digg czy Slashdot, ale obecnie praktyka ta wydaje się być równie skuteczna jak martwa. Niektórzy mogą nadal na to zezwalać, ale jest to metoda prób i błędów, a obejście można zamknąć w dowolnym momencie.
Kolejna sztuczka polegająca na wklejeniu tytułu artykułu do wyszukiwarki w celu bezpośredniego odczytania zapisanej w pamięci podręcznej historii nie wydaje się już działać poprawnie, ponieważ artykuły na stronach z paywallami zwykle nie są już buforowane.
Wskazówka: sprawdź następujący dodatek, którego możesz użyć do ominięcia paywallów:
Agent użytkownika i polecający
Prawdopodobnie zastanawiasz się, w jaki sposób witryny blokują lub zezwalają na dostęp do treści witryny. Metody ulegały poprawie na przestrzeni lat i nie wystarczy już zwykła zmiana strony odsyłającej przeglądarki na https://www.google.com/, aby uzyskać pełny dostęp do zawartości witryny.
Zamiast tego strony wykorzystują różne mechanizmy sprawdzające, które obejmują klienta użytkownika, stronę odsyłającą i pliki cookie, a czasem nawet więcej, w celu ustalenia legalności dostępu.
Informacje ogólne
Prawdopodobnie najlepszym sposobem na zamaskowanie przeglądarki jest sprawienie, by wyglądała jak Googlebot.
- Strona odsyłająca: https://www.google.com/
- User-Agent: Mozilla / 5.0 (zgodny; Googlebot / 2.1; + http: //www.google.com/bot.html
Pamiętaj, że ta opcja nie działa już w wielu witrynach. Lepiej będzie udawać, że pochodzą z Twittera lub innych serwisów społecznościowych.
Firefox
Użytkownicy Firefoksa potrzebują do tego dwóch dodatków do przeglądarki: pierwszy, RefControl, do zmiany wartości strony odsyłającej podczas odwiedzania witryn z wiadomościami, drugi, Przełącznik agenta użytkownika , aby zmienić agenta użytkownika przeglądarki.
Aktualizacja : RefControl nie jest już dostępny. Możesz Spróbuj tego zamiast tego alternatywa. Koniec
- Pobierz i zainstaluj oba rozszerzenia w przeglądarce internetowej Firefox.
- Stuknij w klawisz Alt i wybierz Narzędzia> Opcje RefControl.
- Kliknij „dodaj witrynę”, wprowadź nazwę domeny w witrynie, wybierz działanie niestandardowe i wprowadź https://www.google.com/ jako stronę odsyłającą.
- Powtórz to dla wszystkich witryn z wiadomościami, do których chcesz uzyskać dostęp (niektóre mogą nie działać, nawet jeśli wprowadzisz zmiany, więc miej to na uwadze).
- Po zakończeniu zamknij okno konfiguracji.
- Stuknij ponownie klawisz Alt i wybierz z menu Narzędzia> Domyślny agent użytkownika> Edytuj agentów użytkownika.
- Wybierz Nowy> Klient użytkownika i zamień ciąg w polu Klient użytkownika na Mozilla / 5.0 (zgodny; Googlebot / 2.1; + http: //www.google.com/bot.html). Nazwij go Googlebot.
- Wyjdź z menu.
- Zanim uzyskasz dostęp do tych witryn, dotknij Alt i wybierz Domyślny klient użytkownika> Googlebot.
To wszystko. Trochę niefortunne jest to, że nie ma rozszerzenia dla przeglądarki Firefox, które automatycznie zmienia agenta użytkownika na podstawie odwiedzanych witryn.
Google Chrome
Użytkownicy przeglądarki Google Chrome mogą instalować rozszerzenia, takie jak Przełącznik agenta użytkownika i Kontrola Referer które są dostępne dla przeglądarki, aby robić to samo.
Istnieje jednak inna możliwość, a mianowicie utworzenie niestandardowego rozszerzenia, które automatyzuje proces w przeglądarce.
Instrukcje znajdują się na Elaineou . Wystarczy, że utworzysz nowy katalog na komputerze lokalnym, utworzysz w nim dwa pliki background.js i manifest.json, a następnie skopiujesz i wkleisz kod znaleziony w witrynie do plików.
Musisz włączyć „tryb programisty” na chrome: // extensions /, a następnie wybrać „załaduj rozpakowane rozszerzenie”, aby wybrać folder, w którym utworzyłeś dwa pliki, aby załadować rozszerzenie w Chrome.
Możesz zmodyfikować listę obsługiwanych witryn, aby dodać nowe.