Baca artikel di belakang paywalls dengan menyamar sebagai Googlebot

Internet berada pada titik tip. Peningkatan pengekalan yang berterusan telah menamatkan model pendapatan yang hanya bergantung pada dolar iklan untuk mengendalikan laman web dan perniagaan.

Terutama tapak berita telah mula bereksperimen dengan cara untuk mempelbagaikan sumber pendapatan, dan satu pilihan yang menonjol bahawa laman web seperti The Wall Street Journal, Financial Times, The New York Times atau The Washington Post yang telah dilaksanakan adalah sistem paywall.

Terdapat pelbagai jenis paywalls tetapi mereka semua mempunyai kesamaan yang mereka menyekat akses kepada kandungan sama ada secara langsung atau selepas sejumlah artikel telah dibaca di laman web.

Pelawat kemudian diminta untuk melanggan laman web ini untuk terus membaca artikel di atasnya.

Ia mungkin masuk akal dari sudut pandangan perniagaan, dan mungkin lebih lumayan daripada bertarung dengan pengguna yang menjalankan adblockers, tetapi terdapat kelemahan untuk kedua-duanya untuk laman web paywalled dan pengguna yang disekat.

Tapak kehilangan peratusan pelawat yang tinggi jika mereka melaksanakan sistem paywall. Tidak jelas betapa tinggi peratusannya, dan mungkin berbeza-beza dari tapak ke laman web, tetapi ia mungkin jauh lebih tinggi daripada peratusan pelawat yang melanggan laman web itu selepas dibentangkan dengan pilihan untuk melanggan untuk membaca artikel yang dikehendaki.

Menyamarkan penyemak imbas anda

Bukan rahsia lagi bahawa laman berita membenarkan akses kepada agregator berita dan enjin carian. Sekiranya anda menyemak Google News atau Mencari contoh, anda akan mendapati artikel dari laman web dengan paywalls yang disenaraikan di sana.

Di masa lalu, laman berita membenarkan akses kepada pelawat yang datang dari agregator berita utama seperti Reddit, Digg atau Slashdot, tetapi amalan itu seolah-olah sama seperti hari ini.

Satu lagi helah, untuk menyisipkan tajuk artikel ke dalam enjin gelintar untuk membaca kisah cached di atasnya secara langsung, nampaknya tidak berfungsi dengan baik lagi serta artikel di laman web dengan paywalls tidak biasanya di-cache lagi.

Kemas kini : The Wall Street Journal mengumumkan bahawa ia akan memasuki lubang yang diterangkan di bawah. Anda masih boleh membaca artikel di belakang paywall tapak namun menggunakan kaedah berikut:

  1. Tekan F12 apabila anda berada di halaman artikel dengan artikel potong, dan permintaan untuk melanggan untuk membacanya sepenuhnya.
  2. Buka tab konsol.
  3. Tampal javascript: window.location = "// m.facebook.com/l.php?u="+encodeURIComponent(window.location.href);
  4. Tekan masukkan.

Halaman tersebut perlu dimuat semula, dan artikel itu harus dimuatkan sepenuhnya. Anda juga boleh menyiarkan pautan artikel di Facebook, contohnya dalam jawatan baru yang hanya dapat anda lihat. Mengklik pada pautan yang dipaparkan mesti memuatkan artikel itu sepenuhnya di laman web The Wall Street Journal.

Agen-Pengguna dan Rujuk

Anda mungkin tertanya-tanya bagaimana laman web menghalang atau membenarkan akses ke kandungan tapak. Kaedah telah bertambah baik selama bertahun-tahun, dan tidak lagi cukup untuk mengubah perujuk pelayar ke //www.google.com/ untuk mendapatkan akses penuh ke kandungan tapak.

Sebaliknya, laman web menggunakan pelbagai pemeriksaan yang merangkumi ejen pengguna, perujuk dan cookies, dan kadang-kadang lebih daripada itu, untuk menentukan legitimasi akses.

Maklumat am

Mungkin cara terbaik untuk menyamar penyemak imbas adalah menjadikan ia kelihatan seperti Googlebot.

  • Rujuk: //www.google.com/
  • Agen Pengguna: Mozilla / 5.0 (serasi; Googlebot / 2.1; + // www.google.com/bot.html

Firefox

Pengguna Firefox memerlukan dua penyemak imbas tambahan untuk itu: yang pertama, RefControl, untuk menukar nilai perujuk ketika melawat laman berita, yang kedua, Pengguna Agen Switcher, untuk mengubah ejen pengguna penyemak imbas.

  1. Muat turun dan pasang kedua-dua pelanjutan dalam pelayar web Firefox.
  2. Ketik pada Alt-key, dan pilih Tools> Opsyen RcControl.
  3. Klik pada "menambah tapak", masukkan nama domain di bawah tapak, pilih tindakan tersuai, dan masukkan //www.google.com/ sebagai perujuk.
  4. Ulangi ini untuk semua laman berita yang anda mahu akses (ada yang mungkin tidak berfungsi walaupun anda membuat perubahan, jadi ingatlah itu).
  5. Apabila anda selesai, tutup tetingkap konfigurasi.
  6. Ketuk Alt-lagi sekali lagi, dan pilih Alat> Ejen Pengguna lalai> Edit Ejen Pengguna dari menu.
  7. Pilih New> Ejen Pengguna, dan gantikan rentetan dalam medan Agen Pengguna dengan Mozilla / 5.0 (serasi; Googlebot / 2.1; + // www.google.com/bot.html). Namakannya Googlebot.
  8. Keluar dari menu.
  9. Sebelum anda mengakses laman-laman ini, ketik Alt, dan pilih Agen Pengguna Lalai> Googlebot.

Ini semua ada padanya. Adalah agak malang bahawa tiada pelanjutan untuk Firefox yang mengubah ejen pengguna secara automatik berdasarkan tapak yang anda lawati.

Google Chrome

Pengguna Google Chrome boleh memasang pelanjutan seperti Switcher Ejen Pengguna dan Kawalan Rujukan yang tersedia untuk pelayar untuk melakukan perkara yang sama.

Walau bagaimanapun ada kemungkinan lain, dan itu adalah untuk mewujudkan sambungan khas yang mengautomasikan proses dalam penyemak imbas.

Arahan disediakan di Elaineou. Apa yang diperlukan, pada asasnya ialah untuk mencipta direktori baru pada komputer tempatan, membuat dua background.js dan manifest.json fail di dalamnya, dan salin dan tampal kod yang terdapat di laman web tersebut ke dalam fail.

Anda perlu mendayakan "mod pemaju" pada chrome: // extensions /, dan kemudian boleh memilih "memuatkan sambungan yang tidak dipunggah" untuk memilih folder yang telah anda buat dalam dua fail untuk memuatkan pelanjutan dalam Chrome.

Anda boleh mengubah senarai tapak yang ia menyokong untuk menambah yang baru.