Статьи по Hadoop, Kafka, Kerberos, Apache Ranger и автоматизация

FAQ / Гуру-статья

Топ-5 причин падения Spark-джобов в Kerberos-среде

В Kerberos-среде Spark часто обвиняют в проблемах безопасности, хотя реальная причина может быть в YARN, classpath, delegation tokens, Ranger, Hive Metastore или сетевой доступности KDC. Важно быстро отделить Kerberos-ошибку от похожих симптомов.

Читать статью →

Практика

Как безопасно включить Kerberos в работающем Hadoop-кластере: 3 фатальные ошибки

Kerberos в Hadoop нельзя включать как одну галочку в конфиге. Это изменение затрагивает NameNode, ResourceManager, Hive, Spark, Kafka-интеграции, пользователей, service accounts и все клиентские сценарии.

Читать статью →

Практика

Apache Ranger без хаоса: как подойти к модели политик доступа

Главная проблема Ranger обычно не в установке, а в том, что политики быстро превращаются в набор исключений, временных разрешений и спорных правил.

Читать статью →

Практика

Несколько версий Spark в Hadoop: где чаще всего появляются проблемы

Несколько версий Spark в одном кластере нужны, когда разные команды не могут одновременно переехать на один стек. Но без строгой изоляции это быстро превращается в конфликт зависимостей.

Читать статью →

Практика

YARN, память и LinuxContainerExecutor: зачем нужен контроль на уровне контейнеров

Когда YARN-контейнеры потребляют больше памяти, чем должны, OOM на уровне узла убивает процессы слишком грубо. Для рабочего кластера лучше иметь контролируемое поведение на уровне контейнера.

Читать статью →

Практика

Аудит Hadoop перед обновление: что проверить до окна изменений

Обновление Hadoop редко ломается в одном месте. Обычно проблема появляется на стыке версий, конфигурации, клиентских библиотек, безопасности и прикладных сценариев.

Читать статью →

Практика

Kafka и безопасность: где заканчивается ACL и начинается эксплуатационная модель

Kafka можно закрыть ACL, но для большой платформы этого часто недостаточно. Нужны понятные правила, аудит, жизненный цикл доступов и удобная схема сопровождения.

Читать статью →

Практика

Ansible и GitLab CI для Hadoop/Kafka: как снизить риск ручных ошибок

В больших платформах опасны не только сложные изменения, но и повторяемые ручные действия: правка конфигов, перезапуски, проверки и откаты.

Читать статью →

Практика

Hive hooks в рабочий контур: зачем они нужны и где риск

Hive hooks позволяют встроить дополнительную логику в выполнение запросов: аудит, контроль, маршрутизацию, интеграции и внутренние правила платформы.

Читать статью →

Статьи и практические заметки