Data Scientist in Finerio Connect

Closed job - No longer receiving applicants

Colaborar estrechamente con el equipo de desarrollo de Inteligencia Artificial (IA) para proporcionar acceso a datos limpios y preparados, almacenados y anonimizados en el desarrollo del datalake dentro de la organización contribuyendo al desarrollo de nuevos modelos de IA y la mejora de los modelos existentes dentro de la organización. Esto incluye asegurarse de que los datos sean óptimos para el entrenamiento y análisis de los modelos, manteniendo altos estándares de privacidad y seguridad.

Funciones del cargo

Colaborar estrechamente con el equipo para proporcionar acceso a datos limpios y preparados para su análisis, así como participar en la creación de modelos de IA dentro de la organización.
Diseñar, desarrollar y mantener nuestro sistema de almacenamiento de datos, asegurando que sea escalable, eficiente y seguro para la recopilación, almacenamiento y gestión de datos de múltiples fuentes.
Implementar algoritmos eficientes para anonimizar la información de manera óptima y garantizar la privacidad de los datos.
Diseñar, implementar y mantener nuestro Data Lake, asegurando que cumpla con los requisitos de escalabilidad, rendimiento y seguridad de la organización.
Garantizar el cumplimiento de las normativas de privacidad y seguridad de datos en todos los datos almacenados.
Colaborar con desarrolladores para definir y mantener políticas de retención de datos y purga de datos obsoletos.
Participar activamente en la monitorización y optimización del rendimiento del Data Lake, realizando ajustes y mejoras cuando sea necesario.
Mantenerse al tanto de las mejores prácticas en el campo de Data Lake, Big Data, Machine Learning, LLMS, Deep Learning para garantizar la innovación y la eficiencia continua en el manejo de datos y en el desarrollo de modelos de IA.

Requerimientos del cargo

Formación en Ingenierías de Sistemas computacionales o Ingenierías afines.
Conocimiento de Python Avanzado
Experiencia en la solución de problemas técnicos y el soporte de errores en producción.
Conocimiento de buenas prácticas de seguridad de datos.
Desarrollo y mantenimiento datalakes.

Opcionales

AWS (SageMaker, GLUE, RDS, Kinesis, S3 AIrflow).
LLM ( Large languaje models,).
Marchine Learning (NLP)
Manejo de formatos de archivos Delta, Parquet, CSV

Condiciones

Importante apliques en la siguiente liga: https://goo.su/VxanQ3

Fully remote You can work from anywhere in the world.

Remote work policy

Fully remote

Candidates can reside anywhere in the world.

Life's too short for bad jobs.
Sign up for free and find jobs that are truly your match.