Depuis quelques années, l'apprentissage machine fascine et suscite beaucoup de questions. Fort de 2 ans d'expérimentation dans ce domaine passionnant, voici mon analyse éclairée sur la réalité du ML, au-delà des discours médiatiques.
😲 Le ML n'est pas si complexe... mais demande de la persévérance
Contrairement aux idées reçues, les bases mathématiques sous-jacentes ne sont pas aussi ardues qu'on le prétend. L'essentiel réside dans la logique algorithmique et la maîtrise d'outils comme TensorFlow ou Keras.
Ceci étant, développer des modèles performants requiert de la minutie et de nombreux essais-erreurs. Ne vous découragez pas face aux échecs initiaux, la progression vient lentement mais surement.
😉 Le deep learning n'est pas la seule approche efficace
Bien que fascinant, le deep learning n'est approprié que pour des problématiques très spécifiques comme la vision ou le langage. Pour la majorité des cas d'usage, des algorithmes plus "classiques" comme les forêts aléatoires ou les SVM font très bien l'affaire.
👊 Les jeux de données (dataset) sont le facteur clé de la réussite
On ne le dira jamais assez:garbage in, garbage out. Sans données en quantité et qualité suffisantes, les modèles les plus sophistiqués resteront impuissants. Passer du temps à collecter des données propres est fondamental.
💡 L'interprétabilité des résultats est cruciale en production
Les boîtes noires des réseaux de neurones profonds sont rédhibitoires dans nombre de cas régulés. Il est crucial de pouvoir expliquer les décisions d'un modèle, par exemple via la technique des saliencies.
De même, l'évaluation métier est aussi importante que les métriques mathématiques pour juger de la qualité en conditions réelles.
📡 TensorFlow et PyTorch sont complémentaires
Si TensorFlow demeure le standard industriel grâce à sa communauté massive, PyTorch prend de plus en plus d'ampleur pour ses qualités de simplicité et de rapidité de développement.
Leur apprentissage parallèle est idéal, chacun présentant des forces dans certains domaines comme la vision (Torch) ou le NLP (TensorFlow).
❓ L'avenir est au Machine Learning distribué et décentralisé
Avec la multiplication des objets connectés, les architectures centralisées classiques atteindront leurs limites. Les recherches sur le federated learning ouvrent la voie à des modèles collaboratifs préservant la vie privée.
De même, les projets mariant Blockchain et ML pourront donner naissance à des algorithmes coopératifs sans tiers de confiance, à l'image du récent initiative Cardano.
✍️ Les débouchés sont multiples pour les développeurs qualifiés
Que ce soit en data science, en R&D ou en support client, les profils dotés d'une solide compréhension technique et métier des techniques d'ML sont très recherchés.
A condition de toujours rester curieux et de savoir adapter ses compétences, le machine learning offre d'infinies opportunités dans des secteurs en perpétuelle évolution.