Je suis Warith Harchaoui, docteur en Mathématiques Appliquées et passionné par l'intelligence artificielle (IA).
Je bâtis ma carrière en intelligence artificielle tant dans la recherche que dans les entreprises.
En 2008, j'ai commencé mon apprentissage avec les meilleurs chercheurs en IA grâce à l'École Normale Supérieure de Cachan (MVA M.Sc.). Après plusieurs expériences dans le domaine de la Computer Vision dans des startups et des entreprises internationales, je poursuis mes recherches à l'École Normale Supérieure de Paris aux laboratoires Willow / Sierra qu'on compte parmi les meilleurs au monde.
Plus tard, j'ai renforcé le volet entreprise de ma carrière en Data Science au sein du leader mondial Oscaro.com du e-commerce en pièces automobiles de 2014 à 2020. Tout en gardant mes responsabilités opérationnelles, j'accomplis mon doctorat en mathématiques appliquées de 2016 à 2020 grâce à Charles Bouveyron au laboratoire MAP5 de l'Université de Paris. Aujourd'hui, j'exprime mon expertise en matière de traitements de l'image, du son, de la vidéo et du texte au sein de Jellysmack en tant que Research Fellow avec toujours le même désir de concrétiser des idées d'intelligence artificielle dans le monde réel.
De toutes mes forces, je crois à l'idée que l'intelligence artificielle (IA) doit être comprise comme une révolution comparable à l'agriculture 10 000 ans avant Jésus-Christ, à l'invention de l'écriture 3 000 ans avant Jésus-Christ ou encore à l'imprimerie au 15e siècle.
Par IA, j'entends la définition la plus large : Les mathématiques appliquées avec des ordinateurs connues sous le nom d'apprentissage statistique, de reconnaissance des formes, d'apprentissage automatique, de science des données et même de traitement du signal pour divers supports tels que le son, l'image, la vidéo, le texte et même les données tabulaires. L'impact tangible de l'IA modifie profondément la relation entre notre esprit et le monde.
Pour les entreprises, presque tous les domaines de notre monde contemporain sont désormais impactés par cette Science.
D'un point de vue philosophique, l'IA est l'émergence automatisée de certains aspects de l'intelligence naturelle tels que l'apprentissage, la prise de décision, l'adaptation, la prédiction, l'imitation, la production de contenu, etc. grâce à l'application de mathématiques appliquées aux ordinateurs. Concrètement, l'Intelligence Artificielle est la science qui permet à une machine d'exécuter des tâches sans énumération exhaustive de scénarios par l'intervention humaine. L'IA est l'extension naturelle de l'automatisation de la matière à l'information.
En pratique, cette ambition se traduit par des réalisations en vue de cette étape inévitable pour l'humanité en entretenant des relations étroites avec des universités telles que le laboratoireMAP5, Université de Paris, INRIA Masaai, l'Executive MBA de Rennes School of Business, think tank 4ème Révolution et des entreprises comme Jellysmack, mais aussi grâce à des conseils opérationnels en tant qu'entrepreneur avec Ircam Amplify pour l'analyse et la monétisation de la musique et VizioSense pour la vision par ordinateur embarquée.
Tout au long de mon expérience professionnelle, j'ai compris l'importance de favoriser un environnement de travail collaboratif où toutes les voix et les idées sont entendues. Un projet avec une équipe qui ne s'entend pas bien finit toujours par en payer le prix. C'est pourquoi je recueille les retours de mes collaborateurs et de mes collègues pour améliorer mon travail et celui de mes équipes.
Jellysmack
“Warith est une Bible en IA”
Évaluation annuelle des performances chez Jellysmack, 2022
La diversité des problématiques à résoudre chez Jellysmack conforte l'idée de culture scientifique et de culture d'entreprise sans frontière. Pour les sciences, il s'agit de prendre du recul et de laisser la créativité s'exprimer dans l'inspiration de la littérature publiée. Pour le succès de Jellysmack, il s'agit de contribuer à l'innovation nécessaire pour un marché compétitif au service des créateurs de vidéos sur internet.
Executive MBA de la Rennes School of Business
“Un duo improbable mais incroyable!”
Étudiant, 2022
Donner un cours de 2 jours / 16 heures avec Laurent Pantanacce pour un groupe d'une douzaine d'étudiants expérimentés est un défi. Les retours que nous avons reçus justifient tous les efforts déployés!
Le cours porte sur l'Intelligence Artificielle et ses utilisations en matière de technologie, de produits et de clients
Ircam Amplify
“Merci pour ce super boulot.”
Nathalie Birocheau, fondatrice de Ircam Amplify, 2021
Ça a été un privilège de travailler avec le Centre français de recherche sur la musique, l'Ircam, afin de satisfaire les besoins pragmatiques de l'industrie de la musique. Travailler avec Matthieu Bouxin m'a rappelé une jolie époque d'étudiants quand je travaillais avec lui en Java en écoutant du Pow Wow et du Queen.
VizioSense
“L'expertise de Warith dans les domaines de l'IA et de la vision par ordinateur a joué un rôle clé dans la constitution de l'équipe de R&D.”
Maxime Schacht, fondateur de VizioSense, 2021
Cette expérience de conseil opérationnel en vision par ordinateur a placé la barre haute pour mes futures collaborations : plus de syndrome de l'imposteur, juste du travail ! Traduire ce que la recherche produit de mieux pour ses applications concrètes est ce qui me réveille le matin.
MAP5 Lab de l'Université Paris Descartes
“On sent ta personalité dans ton manuscrit de doctorat !”
Erwann Le Pennec, professeur à l'École polytechnique et rapporteur pour mon jury de doctorat, 2020
Des gens formidables comme Pr. Charles Bouveyron (mon directeur de thèse académique), Dr. Stéphane Raux (mon directeur de thèse en entreprise), Dr. Pierre-Alexandre Mattei et Pr. Andrés Almansa m'ont fait l'honneur de m'aider à accomplir mon travail de doctorat dans la chaleur du laboratoire MAP5 et avec la pugnacité de l'entreprise Oscaro.
Je suis fier d'un défi que j'ai pu relever : un chapitre état de l'art (state of the art) qui reste pertinent aujourd'hui.
Oscaro.com
“Cette collaboration avec l'université a apporté beaucoup de valeur à l'entreprise que j'ai fondée, Oscaro, avec le produit Cerbero.”
Pierre-Noël Luiggi, fondateur d'Oscaro.com, 2020
Aller et venir entre l'université et l'entreprise Oscaro.com pendant mon doctorat a été une expérience formidable. Les questions centrales de mon doctorat y ont naturellement émergées : les groupes de clients, l'incertitude pour la prédiction et les indicateurs de performance utiles et compréhensibles pour ma hiérarchie d'entreprise et mes pairs universitaires.
Dans le domaine de l'intelligence artificielle (IA) qui avance rapidement, il est courant de voir un volume et un rythme très élevés de publications tant scientifiques que non scientifiques. Cependant, il est heureux que des scientifiques expérimentés prennent le temps d'écrire des livres complets qui fournissent un recul précieux avec des vues d'ensembles rétrospectives sur le domaine. Outre le format concis des publications lors des grandes conférences en IA, il est pertinent de se pencher sur les subtilités mathématiques et algorithmiques de ces livres afin de comprendre les travaux plus courts et d'utiliser efficacement les diverses boîtes à outils disponibles en ligne. C'est dans ce contexte que je présente une liste de livres que je trouve particulièrement dignes d'intérêt, ainsi que quelques commentaires, pour les lecteurs désireux de s'engager dans la passionnante "aventure de l'IA".
À notre époque, la langue internationale de l'intelligence artificielle est l'anglais. De la même façon, au temps du britannique Newton au XIXe siècle, ses travaux pionniers en calculs différentiels pour la trajectoire des astres ont été publiés en latin. Al-Khwârizmî au XVIIIe et XIXe siècle, de langue maternelle perse s'est exprimé scientifiquement en arabe et a laissé son nom à l'algorithme qui est l'un des concepts qu'il a su développé avec aussi l'algèbre dont on considère qu'il est le père. C'est pourquoi, je me permets à mon époque en 2022 de me concentrer sur les livres en anglais en recommandant aux jeunes de maîtriser cette langue.
Je n'ai pas encore commenté tous les livres que j'aime jusqu'à présent. En effet, il m'est difficile de commenter les livres de personnes que j'admire d'une manière qui soit utile aux lecteurs, et cela me prend du temps.
Le Machine Learning est la science qui apprend à partir des données qui constitue une expérience acquise en analysant les données au lieu d'une programmation explicite. Pour ce faire, on utilise des algorithmes sur ordinateur qui analysent les données d'entrée, identifient des modèles à l'aide de techniques statistiques et prennent des décisions ou font des prédictions. En conséquence, la machine peut s'adapter à des données nouvelles et inédites et faire des prédictions plus précises.
Pattern Recognition and Machine Learning
Christopher M. Bishop, 2006,
Machine Learning: A Probabilistic Perspective
Kevin Murphy, 2012,
Bayesian Reasoning and Machine Learning
David Barber, 2012,
La vision par ordinateur est un domaine de l'intelligence artificielle qui vise à reproduire les capacités de la vision humaine en apprenant aux ordinateurs à interpréter et à comprendre l'environnement visuel d'une manière similaire à celle des humains. Ce domaine est appliqué à une variété de tâches, par exemple telles que la reconnaissance faciale, la détection d'objets, la conduite autonome et l'imagerie médicale.
Computer Vision: Algorithms and Applications, 2nd Edition
Richard Szeliski, 2022,
Computer Vision: A Modern Approach, 2nd Edition
David Forsyth and Jean Ponce, 2011,
Multiple View Geometry in Computer Vision
Richard Hartley and Andrew Zisserman, 2004,
Le traitement du langage naturel (TAL ou NLP en anglais) permet aux machines d'interpréter et de comprendre le langage humain de texte. Pour ce faire, on utilise des algorithmes qui analysent de grandes quantités de données de texte et le but est d'en extraire son sens. Idéalement, on voudrait ainsi comprendre automatiquement le langage d'une manière similaire à celle des humains. Le NLP est appliqué dans divers contextes, notamment l'optimisation des moteurs de recherche, le résumé automatique, l'analyse des sentiments et la génération de langage naturel.
Neural Network Methods in Natural Language Processing
Yoav Goldberg, 2017,
Foundations of Statistical Natural Language Processing
Chris Manning and Hinrich Schütze, 1999,
Le traitement du signal est la manipulation, l'analyse et la transformation des signaux. Ces signaux peuvent être par exemple des ondes sonores, des ondes radio, des images ou des données provenant d'instruments médicaux. Le traitement du signal est appliqué dans de nombreux contextes, notamment pour son amélioration. Souvent, le traitement du signal consiste à extraire des informations utiles des signaux, comme la fréquence, l'amplitude ou la couleur, et à les modifier pour les rendre plus nets.
A Wavelet Tour of Signal Processing, 3rd Edition
Stéphane Mallat, 2008,
L'apprentissage par renforcement (Reinforcement Learning, RL) consiste à faire apprendre aux machines de leur environnement et à faire des actions qui maximisent les récompenses. Pour ce faire, on donne à l'ordinateur un but ou un objectif numérique, puis on lui fournit un retour d'information après chaque action qu'il effectue sous la forme de punition et de récompense elles aussi numériques. L'ordinateur ajuste alors ses actions en fonction de ce retour d'information, apprenant de ses erreurs et optimisant son comportement au fil du temps. L'apprentissage par renforcement est appliqué dans divers domaines, notamment les jeux, la robotique et les véhicules autonomes. En termes généraux, l'apprentissage par renforcement est le processus qui consiste à apprendre à un ordinateur à effectuer les actions les plus efficaces dans un environnement donné afin de maximiser les récompenses.
Reinforcement Learning, 2nd Edition
Richard S. Sutton and Andrew G. Barto, 2018,
Les algorithmes sont des ensembles d'instructions permettant de résoudre des problèmes de manière systématique. L'optimisation est le processus qui consiste à identifier la manière la plus efficace de résoudre un problème. Essentiellement, les algorithmes et l'optimisation peuvent être considérés comme des techniques soeurs permettant d'améliorer l'efficacité leurs efficacités. Les algorithmes et l'optimisation sont les pierres angulaires de l'intelligence artificielle pour ajuster les paramètres des modèles pour épouser les données. La maîtrise des algorithmes et des techniques d'optimisation fournit les outils théoriques, mais surtout pratiques, permettant d'en créer de nouveaux et d'adapter les anciens pour répondre à la spécificité de vos problèmes du monde réel.
Introduction to Algorithms
Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest and Clifford Stein, 2009,
Convex Optimization
Stephen Boyd and Lieven Vandenberghe, 2004,
Numerical Optimization, 2nd Edition
J. Frédéric Bonnans, J. Charles Gilbert, Claude Lemaréchal and Claudia A. Sagastizábal, 2006,
Numerical Recipes, 3rd Edition
William H. Press, Saul A. Teukolsky, William T. Vetterling and Brian P. Flannery, 2007,
Computational Optimal Transport
Gabriel Peyré and Marco Cuturi, 2019,
Le fait de garder des liens à la fois le monde de l'entreprise et le monde universitaire en intelligence artificielle est probablement le meilleur choix conscient de ma carrière jusqu'à présent. L'industrie et le monde universitaire sont deux mondes très différents, mais ils sont aussi complémentaires selon mon expérience. Parfois, la frontière est floue dans des institutions comme OpenAI ou des entreprises de valorisation dépassant le millier de milliards de dollars comme Microsoft Research, Baidu Research, Amazon Research ou Google Research (liste non exhaustive et dans un ordre aléatoire) qui contribuent avec des articles époustouflants et des boîtes à outils OpenSource comme le feraient d'excellents chercheurs dans des universités au meilleur niveau.
Pour être honnête, partir d'un problème industriel me permet de limiter certaines divagations scientifiques (que j'aime tant car elles sont une source de créativité déguisée !) au profit d'un plus grand impact sur le monde réel... ce qui justifie les efforts. Finalement, je suis récompensé par la satisfaction de faciliter la vie de quelqu'un d'autre, soulagé(e) de son problème initial. Ainsi, à ma façon, j'essaie de contribuer avec ce que je peux à ce rêve millénaire qu'est l'intelligence artificielle. Heureusement, j'ai eu la chance de continuer à travailler dans des environnements tant académiques que corporatifs avec des publications, des enseignements et des prototypes/moteurs en production.
Artificial Intelligence for Business — 2nd Edition
Warith Harchaoui, Laurent Pantanacce and Nicolas Renard, Décembre 2022, Rennes School of Business
Generalised Mutual Information for Discriminative Clustering
Louis Ohl, Pierre-Alexandre Mattei, Charles Bouveyron, Warith Harchaoui, Arnaud Droit, Mickaël Leclercq and Frédéric Precioso, 2022, NEURIPS (ex-NIPS)
Artificial Intelligence for Business — 1st Edition
Warith Harchaoui, Laurent Pantanacce, Mars 2022, Rennes School of Business
Thoughts in 2021 about Hardware in Artificial Intelligence
Warith Harchaoui, Novembre 2021,
Optimal transport-based machine learning to match specific expression patterns in omics data
Thi Thanh Yen Nguyen, Olivier Bouaziz, Warith Harchaoui, Christian Neri, Antoine Chambaz, Juillet 2021,
La valeur de la donnée — Livre blanc pour l'intelligence artificielle
Warith Harchaoui et Laurent Pantanacce, Juin 2021, Closerie des Lilas à Paris pour 4ème Révolution
Invitation à l'intelligence artificielle du texte
Warith Harchaoui, Mai 2021, IUT de l'université de Paris
True Story for a Rare Punctuation Mark
Warith Harchaoui, Mars 2021,
Learning Representations using Neural Networks and Optimal Transport (Ph.D.)
Warith Harchaoui, Septembre 2016 à Octobre 2020, MAP5 — Université Paris Descartes
Mon travail de thèse a été sur l'intelligence artificielle pour:
Rencontre avec Luc Julia, l’IA n’existe pas !⎜ORLM-363
Luc Julia et Warith Harchaoui, Février 2020, IUT de l'université de Paris
Une introduction aux réseaux de neurones
Warith Harchaoui, Décembre 2018, MAP5 — Université Paris Descartes, Institut Henri Poincaré, École 42
Wasserstein Adversarial Mixture Clustering (WAMiC) — Poster
Warith Harchaoui, Pierre-Alexandre Mattei, Andrés Almansa and Charles Bouveyron, Été 2018, Data Science Summer School — École Polytechnique
Artificial Intelligence, Machine Learning, Computer Vision and Natural Language Processing with Python
Warith Harchaoui, Mohamed Chelali, Matias Tassano, Pierre-Louis Antonsanti and Azedine Mani, Dernière mise-à-jour en décembre 2022 (maintenu depuis 2018), MAP5 — Université Paris Descartes
L'intelligence artificielle a besoin de calculs lourds. Pendant les années 2010, la communauté Deep Learning a ouvert la voie de l'accélération matérielle en utilisant historiquement les Unités de Traitement Graphiques (GPU) dédiées à la recherche en Mathématiques Appliquées au-delà du domaine des calculs graphiques.
Le but de cette page est de présenter un cheat sheet pour la programmation en Machine Learning
(c'est-à-dire l'Apprentissage Statistique, la Reconnaissance de Formes, l'Intelligence Artificielle, la Science des Données) pour de nombreuses applications telles que la Vision par Ordinateur, le Traitement du Signal et le Traitement du Langage Naturel.
Cette page a été utilisée de manière intensive au moins dans le MAP5, Oscaro.com, Jellysmack pour les Mathématiques Appliquées pour conduire des recherches en Apprentissage Machine (ML), Vision par Ordinateur (CV) et Traitement du Langage Naturel (NLP) en Python. N'hésitez pas à me contacter (Warith Harchaoui, ) pour des améliorations et des suggestions.