Description de la Caisse des Dépôts
Créée en 1816, pour restaurer la confiance suite à la crise financière, la mission première de la Caisse Des Dépôts est de « recevoir, conserver, rendre les valeurs qui lui sont confiées ». Son modèle économique permet à la Caisse Des Dépôts de gérer en toute sécurité les fonds qui lui sont confiés. Aussi, il exige que le Groupe soit toujours plus performant. Enfin, il repose sur une culture de la mixité qui allie les qualités du public et du privé.
Créée en 2018, la Banque des Territoires est un des cinq métiers de la Caisse des Dépôts. Elle rassemble dans une même structure les expertises internes à destination des territoires. Porte d'entrée client unique, elle propose des solutions sur mesure de conseil et de financement en prêts et en investissement pour répondre aux besoins des collectivités locales, des organismes de logement social, entreprises publiques locales et des professions juridiques. Elle s'adresse à tous les territoires, depuis les zones rurales jusqu'aux métropoles, avec l'ambition de lutter contre les inégalités sociales et les fractures territoriales.
La Banque des Territoires est également une marque déployée dans les 16 directions régionales et les 35 implantations territoriales de la Caisse des Dépôts afin d'être mieux identifiée auprès de ses clients et au plus près d'eux.
Au sein de la Banque des Territoires, la Direction des Prêts est composée de trois départements : Développement (DPHD), Gestion et comptabilité (DPHG), Accompagnement du réseau (DPHA).
Le département du Développement s’appuie sur 6 entités, 3 d’entre elles intervenant sur des segments de marchés (logement locatif social, habitat spécifique et secteur public et projets complexes), les 3 autres étant des fonctions transverses.
Description du poste
Au sein de la Direction des prêts de la Banque des Territoires, en tant que Data Scientist F/H vous serez à titre principal amené.e à réaliser divers études / analyses et à mettre en œuvre divers outils de machine learning. Vous pourrez être amené.e, ponctuellement et lorsque cela sera nécessaire, à participer à l'activité de production de données du service.
Les missions à réaliser seront variées :
Mise en œuvre d'algorithmes de text mining et de traitement du langage sur les différents documents à disposition de la direction des prêts (pièces justificatives des clients, etc.) :
-
Extraction automatique d'informations
-
Classification de documents
-
Amélioration de la qualité des données
Pour cela, la connaissance de différentes approches statistiques, dont l'utilisation de réseaux de neurones, est nécessaire. La mise en œuvre de ces techniques permettra, par exemple, de constituer automatiquement des bases de données pour fiabiliser les données de la DP et les enrichir d'informations supplémentaires. Vous participerez activement au développement de services destinés aux clients de la Direction, sur la base de ce type de technologies.
Travaux à réaliser sur les modèles larges de langage et sur l’ensemble de l’architecture liée à ces solutions :
-
Mise en œuvre du RAG, des solutions de type agent
-
Prétraitement des documents
-
Test et utilisation de différents LLM
Participation à l’industrialisation et à la bonne mise en œuvre de l’ensemble des outils de data sciences utilisées à DPHD80. Code sur Bitbucket, documentation des outils, mise en œuvre de packages, utilisation de Docker
Analyse / collecte de données :
-
Exploitation de bases de données en open data afin d’enrichir la connaissance client (base SQL, fichiers Parquet)
-
Récupération d’informations par web scraping
Profil recherché
La CDC fonde le recrutement sur les compétences en excluant tout critère de discrimination. Tous nos postes sont ouverts aux personnes en situation de handicap.
Vous avez :
-
Une formation scientifique supérieure (BAC+5)
-
Une solide expérience en modélisation / mathématiques appliquées et machine learning
-
Une utilisation avérée de LLM et des librairies liées (déploiement de petits LLM en local)
-
Une expérience avérée en estimation de modèle de Deep learning et en fine tuning de ces modèles (Bert).
-
Bonne maîtrise des dernières évolutions dans le domaine de l'IA et du deep learning.
-
un savoir-faire en mise en œuvre des outils d'IA dans le domaine du traitement du texte, de l'image et de données plus classiques.
-
Excellente connaissance de la programmation en particulier python et les librairies tensorflow, scikitlearn, pandas, numpy
-
Capacité à construire des solutions opérationnelles et industrialisables pertinentes
Qualités personnelles attendues :
Vous disposez des capacités personnelles suivantes :
Qualités d'analyse, de synthèse et de rédaction
Bonnes qualités relationnelles
Curiosité, rigueur, autonomie, capacité à faire des propositions innovantes.
Résumé de l'offre
- Référence de l'offre : 9xwopz1hh9
- Intitulé de l'offre : DATA SCIENTIST F/H
- Localisation du poste : Paris (75013)
- Type de contrat : CDI, Fonctionnaire
- Catégorie de contrat : Cadre
- Filière : Numérique
- Prime variable sur objectif : PVO à 8%
- Régime de travail : Forfait
- Eligibilité télétravail : Oui
- Encadrant : Non
L’offre vous intéresse ? Postulez
« * » indique les champs nécessaires
