Условие:
Описание задания
Разработайте R-скрипт, который выполняет три этапа сбора данных с Google Maps или Yandex Maps, включая (1) объекты, (2) отзывы и (3) информацию по пользователям. Выберите в качестве объектов музеи и культурные заведения Санкт-Петербурга.
Требования к этапам парсинга:
Сбор информации об объектах
Название
Категория (музей, театр и т. д.)
Адрес
Средний рейтинг
Количество отзывов
Ссылка на объект
Любые другие доступные параметры
Сбор отзывов по каждому объекту
ID объекта (связь с первой таблицей)
Текст отзыва
Дата отзыва
Оценка (звезды)
Количество лайков на отзыв
Сбор информации о пользователях, оставивших отзывы
ID пользователя (связь со второй таблицей)
Имя (если доступно)
Количество оставленных отзывов
Средняя оценка отзывов пользователя
Финальные материалы
Для сдачи работы предоставьте:
Три итоговые таблицы (CSV или Excel):
Объекты
Отзывы
Пользователи
Рабочий скрипт на R, который должен:
Содержать четкую структуру с комментариями для каждого этапа
Корректно обрабатывать возможные ошибки (отсутствие данных, блокировки, лимиты запросов)
Обеспечивать связь между таблицами (ID объекта в таблице отзывов, ID пользователя в таблице пользователей)
Отчет, который должен:
Описание собранных данных
Проверку гипотез при помощи любых методов статистики (например, t-test, корреляция, регрессия и т.д.)
Визуализацию (например графики распределения переменных, карты и т.д.)
Готовый скрипт и таблицы отправьте в ответном письме. Итоговая оценка фиксируется после проверки, и она может как повыситься, так и понизиться.
