Résumé:
Depuis plusieurs décennies, la reconnaissance des chiffres manuscrits est une voie
traditionnelle, qui a attiré l’attention des chercheurs et il reste un domaine de recherche très
ouvert, dû à son grand nombre d’applications pratiques. En raison du progrès des
technologies actuelles, telles que les dispositifs de capture de l'écriture manuscrite et les
ordinateurs portables les plus puissants, le scénario actuel appelle à la nécessité d'une
reconnaissance performante des chiffres manuscrits dans les banques, pour identifier les
chiffres sur un chèque bancaire. De plus, il peut être utilisé dans les bureaux de poste pour
identifier les numéros de boîte à code PIN. La création d'un système de reconnaissance à
haute fiabilité définit la motivation principale de ce projet.
L’objectif de ce projet est de créer un modèle qui sera capable de reconnaître et de
déterminer les chiffres manuscrits de la base de données MNIST en utilisant les concepts de
de l’algorithme kNN (Méthode des k plus proches voisins). L’espace des caractéristiques de
la base de données MNIST des images numériques manuscrites (0-9) est de 784 dimensions.,
elle a donc de nombreuses dimensions. Un outil de réduction de dimension est mis en œuvre
pour réduire les éléments en un petit ensemble informatif de caractéristiques, avant d'utiliser
les données dans notre modèle d'apprentissage automatique. Cela permet un apprentissage
rapide de modèle et une capacité de bien visualiser les clusters.
Après la réduction de la dimensionnalité de l'ACP, le KNN final a atteint une précision
de classification de plus de 97% dans un espace des caractéristiques de 100 dimensions