Python: Les fonctions ordinaires versus les générateurs pour le web scraping

J’ai regardé des programmes pour faire du web scraping avec le module Scrapy de python. Mon but était de créer un robot d’indexation pour certaines sites web. J’ai remarqué que les programmes de Scrapy pour faire ce travail se servaient du mot «yield» au lieu de «return» lorsqu’il y avait un objet a retourné. Je ne savais pas sa utilité. Puis j’ai appris que «yield» est utilisé pour créer un générateur.

Lire la suite

Choisir un Python IDE

Au début, j’ai commencé avec Pycharm de Jetbrains. Très bon choix. En fait Dan Bader le recommande sur sa chaîne YouTube. Puis, j’ai essayé Visual Studio Code, car il reçoit de bonnes critiques. Mauvais choix. J’ai eu trop de problèmes et finalement je ai dû l’abandonné.

Monsieur Bader recommande Pycharm pour un IDE complet. Pour les débutants, qui veulent un éditeur simple avec un excellent débogueur il recommande Thonny. J’ai commencé à l’utiliser et je l’adore. Excellent choix pour les débutants qui ne veulent pas compliquer la vie et le débogueur aide beaucoup à comprendre comment le code s’exécute.

Lire la suite

Expressions régulières première partie (sed, vim et python)

J’ai lu le livre «Sams Teach Yourself regular expressions in 10 Minutes» de Ben Forta. Celui-ci est une bonne introduction à des expressions régulières. Mais, à mon avis il y a des lacunes. D’abord, l’auteur ne parle pas de comment remplacer.

Ensuite, le livre est agnostic par rapport au language. J’ai dû adapter la syntaxe des expressions régulières aux commandes «sed» dans le terminal de Linux ainsi que l’editor Vim. Lorsqu’on se sert des expressions régulières en python, la syntaxe est encore différente.

Cela dit, les différences sont au niveau de syntaxe. Les règles de base sont pareilles.

Voici des exemples des différences entre l’éditeur de texte Vim, Sed et Python pour la même expression régulière:

Lire la suite