Бот "Антиспам 3000"
Персональный ИИ-менеджер чата
Бот парсер заявок для SMM-агентства
Задача бот-парсера для digital-агентства "AVENU" отобрать релевантные и максимально выгодные заявки по заказам из мессенджера Telegram (в дальнешем планируется расширение на другие ресурсы).
Парсер мониторит большую сетку чатов и каналов (1000+), обрабатывает огромный поток сообщений (более 50 000 сообщений в сутки) и хирургично изымает подходящие под услуги агенства запросы.
Разоработка сокращает трудозатраты менеджеров (свыше 20 часов в неделю) и приносит бизнесу регулярный, стабильный доход.
Его функционал:
- Сбор сообщений из чатов/каналов. Работает через MTProto (Telethon), может стабильно читать и анализировать контент там, где обычные боты на BotAPI не имеют такой возможности.
- Умная фильтрация заявок. Сообщение оценивается не по набору ключевых слов, а через LLM-классификацию: основной движок — DeepSeek, при недоступности подключается запасной провайдер (ChatGPT, если и он не доступен - Gemini). Стабильность и беспрерывность работы превыше всего.
- Категоризация отбора по направлениям агентства. Заявки автоматически раскладываются по категориям (SMM, Дизайн, Сайты, Маркетинг и др.). Удобно и быстрой, сразу задачу подхватывает нужный специалист.
- Проверка “реальности” пользователя и его сообщения. Несколько уровней валидации отправителя/контекста (включая обход анонимности и сложных сценариев Telegram). Свыше 12 этапов проверки сообщения. Суть подхода проста: вычислить, не является ли сообщение спамом (фильтр система, база данных сообщений с их авторами), можно ли связаться с автором сообщения, и если можно, то через какие контакты (иногда юзернейм спарсить невозможно из-за ограничений мессенджера, задача алгоритма - сделать невозможное возможным).
- Оптимизация хранения. Бот ведёт базу пользователей и сообщений аккуратно: не захламляет хранилище, отсекает повторы, чистит старые записи. Данный подход экономит место на диске сервера и уменьшает затраты использования ОЗУ.
- Панель администратора и статистика. Сбор метрик по чатам и периодам (день/неделя/месяц): сколько сообщений обработано и сколько из них прошло фильтрацию как релевантные.
Стек: Python + asyncio, Telethon, SQLite, aiohttp/асинхронные хранилища. Проект рассчитан на работу 24/7: параллельная обработка, стабильное соединение и контроль состояния.