L'apprentissage automatique, comme son nom l'indique, est la science de la programmation d'un ordinateur grâce auquel ils peuvent apprendre à partir de différents types de données. Une définition plus générale donnée par Arthur Samuel est la suivante: «L'apprentissage automatique est le domaine d'étude qui donne aux ordinateurs la capacité d'apprendre sans être explicitement programmé.» Ils sont généralement utilisés pour résoudre divers types de problèmes de la vie.
Autrefois, les personnes effectuaient des tâches d'apprentissage automatique en codant manuellement tous les algorithmes, ainsi que les formules mathématiques et statistiques. Cela rendait le processus long, fastidieux et inefficace. Mais dans les temps modernes, il est devenu très facile et efficace par rapport aux systèmes anciens par diverses bibliothèques, frameworks et modules Python. Aujourd'hui, Python est l'un des langages de programmation les plus populaires pour cette tâche. Il a remplacé de nombreux langages dans l'industrie, notamment grâce à sa vaste collection de bibliothèques. Les bibliothèques Python utilisées dans Machine Learning sont les suivantes:
- Numpy
- Scipy
- Scikit-apprendre
- Theano
- TensorFlow
- Keras
- PyTorch
- Pandas
- Matplotlib
Numpy
NumPy est une bibliothèque python très populaire pour le traitement de matrices et de tableaux multidimensionnels multidimensionnels, à l'aide d'une vaste collection de fonctions mathématiques de haut niveau. C'est très utile pour les calculs scientifiques fondamentaux en Machine Learning. Il est particulièrement utile pour l'algèbre linéaire, la transformée de Fourier et les capacités de nombres aléatoires. Les bibliothèques haut de gamme telles que TensorFlow utilisent NumPy en interne pour la manipulation de Tensors.
|
Sortie:
219 [29 67] [[19 22] [43 50]]
Pour plus de détails, voir Numpy.
SciPy
SciPy est une bibliothèque très populaire parmi les passionnés d’apprentissage automatique car elle contient différents modules d’optimisation, d’algèbre linéaire, d’intégration et de statistiques. Il existe une différence entre la bibliothèque SciPy et la pile SciPy. Le SciPy est l’un des principaux packages qui composent la pile SciPy. SciPy est également très utile pour la manipulation d'images.
|
Image originale:
Image teintée:
Image teintée redimensionnée:
Pour plus de détails, reportez-vous à la documentation.
Scikit-apprendre
Skikit-learn est l’une des bibliothèques ML les plus populaires pour les algorithmes ML classiques. Il est construit sur deux bibliothèques Python de base, à savoir, NumPy et SciPy. Scikit-learn supporte la plupart des algorithmes d'apprentissage supervisé et non supervisé. Scikit-learn peut également être utilisé pour l'exploration et l'analyse de données, ce qui en fait un excellent outil pour les débutants en ML.
|
Sortie:
DecisionTreeClassifier (class_weight = None, critère = 'gini', max_depth = None, max_features = None, max_leaf_nodes = None, min_impurity_decrease = 0.0, min_impurity_split = None, min_samples_leaf = 1, min_samples_split = 2, min_weight_fraction_leaf = 0.0, presort = False, random_state = None, séparateur = 'meilleur') rappel de précision soutien f1-score 0 1,00 1,00 50 1 1,00 1,00 1,50 50 2 1,00 1,00 50 micro moy. 1,00 1,00 150 macro moy. 1.00 1.00 1.00 150 poids moyen 1,00 1,00 150 [[50 0 0] [ 0 50 0] [ 0 0 50]]
Pour plus de détails, reportez-vous à la documentation.
Theano
Nous savons tous que l’apprentissage automatique se compose essentiellement de mathématiques et de statistiques. Theano est une bibliothèque Python populaire utilisée pour définir, évaluer et optimiser les expressions mathématiques impliquant des tableaux multidimensionnels de manière efficace. Ceci est réalisé en optimisant l'utilisation du processeur et du processeur graphique. Il est largement utilisé pour les tests unitaires et l'auto-vérification afin de détecter et de diagnostiquer différents types d'erreurs. Theano est une bibliothèque très puissante utilisée depuis longtemps dans des projets scientifiques de grande envergure, à forte intensité de calcul, mais assez simple et accessible pour être utilisée par des individus dans le cadre de leurs propres projets.
|
Sortie:
tableau ([[0.5, 0.73105858], [0.26894142, 0.11920292]])
Pour plus de détails, reportez-vous à la documentation.
TensorFlow
TensorFlow est une bibliothèque open source très populaire pour le calcul numérique hautes performances développée par l'équipe Google Brain de Google. Comme son nom l'indique, Tensorflow est un framework qui implique la définition et l'exécution de calculs impliquant des tenseurs. Il peut former et gérer des réseaux de neurones profonds pouvant être utilisés pour développer plusieurs applications d'intelligence artificielle. TensorFlow est largement utilisé dans le domaine de la recherche et de l’application de l’apprentissage en profondeur.
|
Sortie:
[ 5 12 21 32]
Pour plus de détails, reportez-vous à la documentation.
Keras
Keras est une bibliothèque très populaire d’apprentissage automatique pour Python. Il s’agit d’une API de réseaux de neurones de haut niveau capable de s’exécuter sur TensorFlow, CNTK ou Theano. Il peut fonctionner de manière transparente sur le processeur et le processeur graphique. Keras permet aux débutants de ML de créer et de concevoir un réseau de neurones. Une des meilleures choses à propos de Keras est qu’il permet un prototypage simple et rapide.
Pour plus de détails, reportez-vous à la documentation.
PyTorch
PyTorch est une bibliothèque populaire d'apprentissage Machine Open Source pour Python basée sur Torch, qui est une bibliothèque Machine Learning Open Source mise en œuvre en C avec un wrapper dans Lua. Il propose un vaste choix d'outils et de bibliothèques prenant en charge Computer Vision, le traitement du langage naturel (NLP) et de nombreux autres programmes ML. Il permet aux développeurs d'effectuer des calculs sur les tenseurs avec accélération GPU et facilite également la création de graphiques de calcul.
|
Sortie:
0 47168344.0 1 46385584.0 2 43153576.0 ... ... ... 497 3.987660602433607e-05 498 3.945609932998195e-05 499 3.897604619851336e-05
Pour plus de détails, reportez-vous à la documentation.
Pandas
Pandas est une bibliothèque Python populaire pour l'analyse de données. Ce n'est pas directement lié à l'apprentissage automatique. Comme nous savons que le jeu de données doit être préparé avant la formation. Dans ce cas, les pandas sont pratiques car ils ont été développés spécifiquement pour l'extraction et la préparation de données. Il fournit des structures de données de haut niveau et de nombreux outils pour l'analyse des données. Il fournit de nombreuses méthodes intégrées pour tâtonner, combiner et filtrer les données.
|
Sortie:
Pour plus de détails, reportez-vous aux pandas.
Matplotlib
Matpoltlib est une bibliothèque Python très populaire pour la visualisation de données. Comme les pandas, il n’est pas directement lié à l’apprentissage automatique. Cela s'avère particulièrement utile lorsqu'un programmeur souhaite visualiser les modèles dans les données. C'est une bibliothèque de tracé 2D utilisée pour créer des graphiques et des tracés 2D. Un module appelé pyplot facilite le traçage des programmeurs car il offre des fonctionnalités permettant de contrôler les styles de trait, les propriétés de police, les axes de formatage, etc. Il fournit différents types de graphiques et de tracés pour la visualisation des données, l'affichage, l'histogramme, les graphiques d'erreur, les discussions en barres. , etc,
|
Sortie:
Pour plus de détails, reportez-vous à la documentation.
Si vous aimez GeeksforGeeks et souhaitez contribuer, vous pouvez également écrire un article en utilisant contribue.geeksforgeeks.org ou envoyer votre article par courrier électronique à l'adresse suivante: contribue@geeksforgeeks.org. Consultez votre article sur la page principale de GeeksforGeeks et aidez les autres Geeks.
S'il vous plaît, améliorez cet article si vous trouvez des erreurs en cliquant sur le bouton "Améliorer l'article" ci-dessous.
Pouce en l'air
4
Veuillez nous écrire à l'adresse suivante: contribue@geeksforgeeks.org pour signaler tout problème lié au contenu ci-dessus.