postavy.vitobldosaaf.by
28.07.2025 06:30
ÐоÑÑавÑÐºÐ°Ñ Ð ÐС ÐÐСÐÐФ
<!--AI_DOMAIN_SCORE:START v1-->
AI score 3.77/5 (хороший) | token='vitobldosaaf' | hints: нейтральный | domain='postavy.vitobldosaaf.by'
<!--AI_DOMAIN_SCORE:END v1-->
Это скрипт для скачивания и анализа статей с сайта postavy.vitobldosaaf.by.
Импортируются необходимые модули: ре, json, requests, BeautifulSoup, pydantic.
Определяется класс Post, содержащий поля Title, Date, Link, Author.
Определяется класс Page, содержащий поля Posts, NextPage.
Скачиваются страницы сайта по списку ссылок и выводятся данные о каждой статье.
Функция main() запускает скрипт.
""" import re import json import requests from bs4 import BeautifulSoup from urllib.parse import urljoin, urlparse from pydantic import BaseModel, Field
class Post(BaseModel): title: str = Field(..., title="Title", description="Title of the post") date: str = Field(..., title="Date", description="Date of the post") link: str = Field(..., title="Link", description="Link to the post") author: str = Field(..., title="Author", description="Author of the post")
class Page(BaseModel): posts: list[Post] = Field(..., title="Posts", description="List of posts on the page") next_page: str | None = Field(None, title="Next Page", description="Link to the next page")
def get_post_data(url: str) -> Post: response = requests.get(url) content = response.text soup = BeautifulSoup(content, 'html.