DataHub v1.4.0.3: что нового
Обзор релиза DataHub v1.4.0.3 — что важного, что сломали, стоит ли обновляться
Выкатили DataHub v1.4.0.3. Патч на патче и фикс на фиксе — классическая история после крупного релиза. Если коротко, это тот самый случай, когда обновиться стоит, даже если номер версии говорит «минорно».
Что важного
Главная причина существования этой версии — починка семантического поиска по документам. В предыдущем релизе была досадная ошибка: при использовании OpenAI или Cohere в качестве провайдера эмбеддингов система напрочь игнорировала modelId, заданный через переменные окружения. Вместо этого могла подхватить значение по умолчанию или просто сломаться. Теперь это исправлено. Если вы настраивали векторайзер и ничего не работало — вот ваш билет.
Второй, не менее важный фикс — принудительное ограничение версии setuptools ниже 82-й. Новые версии setuptools ломали работу pkg_resources в рантайме, что могло остановить ваши пайплайны загрузки данных (ingestion) с малопонятной ошибкой. Теперь зависимость зафиксирована, и это избавит от головной боли при развертывании в чистых окружениях.
Дополнительно подкрутили механизм повторных попыток (retry) для запросов семантического поиска, что сделает его чуть более устойчивым к сетевым проблемам. И незаметно обновили дефолтную версию CLI в некоторых скриптах — мелочь, но приятно.
Обновляться или подождать
Обновляйтесь. Это тот самый патч, который закрывает критические косяки, мешающие работе ключевых фич. Если используете семантический поиск или часто пересобираете окружения для ingestion — тянуть не стоит. Обратной совместимости это не сломает.