Releases
DataHub

DataHub v1.4.0.3: что нового

Обзор релиза DataHub v1.4.0.3 — что важного, что сломали, стоит ли обновляться

Выкатили DataHub v1.4.0.3. Патч на патче и фикс на фиксе — классическая история после крупного релиза. Если коротко, это тот самый случай, когда обновиться стоит, даже если номер версии говорит «минорно».

Что важного

Главная причина существования этой версии — починка семантического поиска по документам. В предыдущем релизе была досадная ошибка: при использовании OpenAI или Cohere в качестве провайдера эмбеддингов система напрочь игнорировала modelId, заданный через переменные окружения. Вместо этого могла подхватить значение по умолчанию или просто сломаться. Теперь это исправлено. Если вы настраивали векторайзер и ничего не работало — вот ваш билет.

Второй, не менее важный фикс — принудительное ограничение версии setuptools ниже 82-й. Новые версии setuptools ломали работу pkg_resources в рантайме, что могло остановить ваши пайплайны загрузки данных (ingestion) с малопонятной ошибкой. Теперь зависимость зафиксирована, и это избавит от головной боли при развертывании в чистых окружениях.

Дополнительно подкрутили механизм повторных попыток (retry) для запросов семантического поиска, что сделает его чуть более устойчивым к сетевым проблемам. И незаметно обновили дефолтную версию CLI в некоторых скриптах — мелочь, но приятно.

Обновляться или подождать

Обновляйтесь. Это тот самый патч, который закрывает критические косяки, мешающие работе ключевых фич. Если используете семантический поиск или часто пересобираете окружения для ingestion — тянуть не стоит. Обратной совместимости это не сломает.