Python Kullanarak Web Siteden Veri Çekme

Merhabalar, interneteki türkçe kaynakları incelediğimde genelde python2x için örnekler verilmiş ve herhangi bi framework kullanılmamış. Bu durumu çözmek adına 3x version kullanıcam ve daha iyi işler çıkarabilmeniz adına bi framework üzerinden gidicem.

Kullnacağımız framework  : BeautifulSoup

Kaynakhttps://www.crummy.com/software/BeautifulSoup/bs4/doc/

BeautifulSoup Kurulumu

Kurulumu pip ile sağlıyacağız. Eğer verdiğim talimaları uyguladığınız halde halen hata aliyorsanız aşşağıdaki kaynağa bakabilirsiniz.

Kurulum kaynağı : https://www.crummy.com/software/BeautifulSoup/bs4/doc/#installing-beautiful-soup


Şimdi bir örnek yapalım! örneğimizde bir web sitedeki tüm html dökümanı çekeceğiz.

kodu denerseniz, ekrana baya çıktı atacaktır. Çünkü herhangi bi filitre işlemi kullanmadan tüm html dökümanı çekmiş olduk.

BeautifulSoup‘un sevilen özelliklerini göreceğiz şimdi ;

  • soup.(head,title,body,a) vb. işlemleri ile direk istediğimiz bölümü çekebiliriz.

Şimdi filitre işlemi yapalım. Kullnacağımız fonksiyon “find_all” bu fonksiyon sayesinde istediğimiz filitreleri yollayabiliriz.

  • Burada “a” taglarını çek ama çekerken bana 1 tane yeterli komutunu verdik.

En yukarda verdiğimiz kaynağı incelerseniz, bir çok fonksiyonlar mevcut. Hepsini tek tek incelemek yerine kapsamlı bir örnek yapalım.

Yapacağımız örnek ise, sitedeki yazı içeriğini ve başlığı çekmek olacaktır.

ÖRNEK :  Sitedeki içerik kısmını ve başlığı çekin.

İlk işlem olarak tabi, url belirledik ve okuduk.

  • ‘div’ etiketinde , sing-post-content clasına bağlı kısmı çektik. Daha sonrasına verileri liste olarak tuttuğu için icerik[0].text diyerek html kısımları kırparak text’e çevirdik.

Şimdi title kısmını çekelim.

Bu şekilde bir sitedeki içerik ve başlık kısmını çektik. Umarım faydalı olmuştur.

“Python Kullanarak Web Siteden Veri Çekme” için 5 cevap

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak.