Apprentissage statistique en acquisition linguistique – Apprendre une langue étrangère

Apprentissage statistique est la capacité pour les humains et les autres animaux d’extraire des régularités statistiques du monde qui les entoure pour en apprendre davantage sur l’environnement. Bien que l’apprentissage statistique soit maintenant considéré comme un mécanisme d’apprentissage généralisé, le phénomène a été identifié pour la première fois dans l’acquisition du langage chez l’enfant.

Les premières preuves de ces capacités d’apprentissage statistique proviennent d’une étude menée par Jenny Saffran, Richard Aslin et Elissa Newport, dans laquelle on a présenté à des enfants âgés de 8 mois des jets non verbaux de discours monotones. Chaque flux était composé de quatre «pseudowords» de trois syllabes, répétés de manière aléatoire. Après une exposition de deux minutes aux flux de parole, les bébés réagissent différemment en entendant des «pseudo-mots» par opposition aux «non-mots» du flux de parole, dans lesquels les non-mots sont composés des mêmes syllabes que les enfants, mais dans un ordre différent. . Cela suggère que les nourrissons sont capables d'apprendre des relations statistiques entre les syllabes même avec une exposition très limitée à une langue. C'est-à-dire que les bébés apprennent quelles syllabes sont toujours appariées et lesquelles n'apparaissent que relativement rarement, ce qui suggère qu'elles font partie de deux unités différentes. Cette méthode d'apprentissage est considérée comme un moyen par lequel les enfants apprennent quels groupes de syllabes forment des mots individuels.[[[[citation requise]

Depuis la découverte initiale du rôle de l'apprentissage statistique dans l'acquisition lexicale, le même mécanisme a été proposé pour les éléments d'acquisition phonologique et d'acquisition syntaxique, ainsi que dans les domaines non linguistiques. Des recherches ultérieures ont également montré que l’apprentissage statistique est probablement un mécanisme d’apprentissage général, voire général, des domaines, qui intervient à la fois pour des informations visuelles et auditives, ainsi que pour les primates et les non-primates.

Acquisition Lexical[[[[modifier]

Le rôle de l'apprentissage statistique dans l'acquisition d'une langue a été particulièrement bien documenté dans le domaine de l'acquisition lexicale.[1] Une contribution importante à la compréhension par les bébés de la segmentation des mots à partir d'un flux de parole continu est leur capacité à reconnaître les régularités statistiques du discours entendu dans leur environnement.[1] Bien que de nombreux facteurs jouent un rôle important, ce mécanisme spécifique est puissant et peut fonctionner sur une courte période.[1]

Résultats originaux[[[[modifier]

Un spectrogramme d'un locuteur masculin prononçant l'expression "XIXe siècle". Il n'y a pas de démarcation claire où un mot se termine et le suivant commence.

Il est bien établi que contrairement à la langue écrite, la langue parlée n’a pas de frontière claire entre les mots; la langue parlée est un flux sonore continu plutôt que des mots individuels avec des silences entre eux.[2] Ce manque de segmentation entre les unités linguistiques pose un problème aux jeunes enfants apprenant une langue, qui doivent être en mesure de sélectionner des unités individuelles parmi les flux de parole continus qu'ils entendent.[3] Une méthode proposée pour aider les enfants à résoudre ce problème consiste à être attentifs aux régularités statistiques du monde qui les entoure.[2][3] Par exemple, dans la phrase «joli bébé», les enfants sont plus susceptibles d’entendre les sons pré et ty entendus ensemble pendant la totalité de l'entrée lexicale autour d'eux que pour entendre les sons ty et ba ensemble.[3] Saffran, Newport et Aslin ont découvert dans une étude sur l'apprentissage de la grammaire artificielle auprès de participants adultes que les participants étaient capables de localiser les limites de mots en fonction de probabilités transitionnelles, suggérant que les adultes sont capables d'utiliser des régularités statistiques dans une tâche d'apprentissage linguistique.[4] Ceci est une conclusion robuste qui a été largement reproduite.[1]

Pour déterminer si les jeunes enfants ont les mêmes capacités, Saffran Aslin et Newport ont exposé les nourrissons de 8 mois à une grammaire artificielle.[3] La grammaire était composée de quatre mots, chacun composé de trois syllabes sans signification. Au cours de l'expérience, les nourrissons ont entendu un discours continu de ces mots. Il est important de noter que le discours a été présenté de manière monotone, sans indication (telles que pauses, intonation, etc.) sur les limites des mots autres que les probabilités statistiques. Dans un mot, la probabilité de transition de deux paires de syllabes était de 1,0: dans le mot bidaku, par exemple, la probabilité d'entendre la syllabe da immédiatement après la syllabe bi était de 100%. Cependant, entre les mots, la probabilité transitoire d’entendre une paire de syllabes était beaucoup plus faible: après un mot donné (par exemple, bidaku) a été présenté, un des trois mots peut suivre (dans ce cas, padoti, Golabu, ou tupiro), donc la probabilité d’entendre une syllabe donnée après ku était seulement 33%.

Pour déterminer si les statistiques relevaient des nourrissons, on a présenté à chaque nourrisson plusieurs présentations d'un mot de la grammaire artificielle ou d'un mot non composé de la même syllabe mais présentées dans un ordre aléatoire. Les nourrissons à qui on a présenté des non-mots pendant la phase de test ont écouté ces mots considérablement plus longtemps que les nourrissons à qui ont été présentés des mots de grammaire artificielle, montrant une préférence pour la nouveauté de ces nouveaux non-mots. Cependant, la mise en œuvre du test pourrait également être due à l'apprentissage par les bébés de l'information d'ordre en série et non à l'apprentissage des probabilités de transition entre les mots. C’est-à-dire que, lors du test, les nourrissons ont entendu des chaînes telles que: dapiku et tilado qui n'ont jamais été présentés pendant l'apprentissage; ils auraient simplement pu apprendre que la syllabe ku jamais suivi la syllabe pi.[3]

Pour examiner de plus près cette question, Saffran Aslin et Newport ont mené une autre étude dans laquelle les nourrissons avaient suivi le même entraînement avec la grammaire artificielle, mais étaient ensuite présentés avec des mots ou des mots partiels plutôt que des mots ou des non-mots.[3] Les mots partiels étaient des séquences de syllabes composées de la dernière syllabe d'un mot et des deux premières syllabes d'un autre (comme Kupado). Parce que les mots partiels avaient été entendus au moment où les enfants écoutaient la grammaire artificielle, une écoute préférentielle de ces mots partiels indiquerait que les enfants apprenaient non seulement des informations d'ordre, mais aussi la probabilité statistique d'entendre des séquences de syllabes particulières . Encore une fois, les nouveau-nés (parties) étaient plus longs à écouter, ce qui indique que les nourrissons âgés de 8 mois étaient capables d'extraire ces régularités statistiques d'un flux de parole continu.

De plus amples recherches[[[[modifier]

Ce résultat a été l’élan de beaucoup plus de recherches sur le rôle de l’apprentissage statistique dans l’acquisition lexicale et d’autres domaines (voir plus loin). [1]). Dans le prolongement du rapport initial,[3] Aslin, Saffran et Newport ont constaté que même lorsque les mots et les mots partiels apparaissaient aussi souvent dans le flux de parole, mais avec des probabilités de transition différentes entre les syllabes des mots et les mots partiels, les nourrissons étaient toujours capables de détecter les régularités statistiques et préféraient toujours écouter les régularités statistiques. les nouveaux mots de la partie sur les mots familiarisés.[5] Cette découverte fournit des preuves plus solides que les bébés sont capables de saisir les probabilités de transition du discours qu’ils entendent, au lieu d’être simplement conscients des fréquences de séquences de syllabes individuelles.[1]

Une autre étude de suivi a examiné dans quelle mesure les informations statistiques acquises au cours de ce type d’apprentissage de la grammaire artificielle s’enrichissaient dans les connaissances que les nourrissons avaient déjà de leur langue maternelle.[6] Les nourrissons préfèrent écouter les mots plutôt que les mots partiels, alors qu'il n'y avait pas de différence significative dans les conditions de non-sens. Cette découverte suggère que même les bébés pré-linguistiques sont capables d’intégrer les indices statistiques qu’ils apprennent en laboratoire à leur connaissance d’une langue acquise précédemment.[1][6] En d'autres termes, une fois que les bébés ont acquis certaines connaissances linguistiques, ils intègrent les informations nouvellement acquises à cet apprentissage déjà acquis.

Une découverte connexe indique que les nourrissons légèrement plus âgés peuvent acquérir des régularités lexicales et grammaticales à partir d’un seul ensemble d’entrées.[7] suggérant qu'ils sont capables d'utiliser les sorties d'un type d'apprentissage statistique (indices qui conduisent à la découverte des limites de mots) comme entrée d'un second type (indices conduisant à la découverte de régularités syntaxiques.[1][7] Au test, les enfants de 12 mois préféraient écouter des phrases ayant la même structure grammaticale que le langage artificiel sur lequel elles avaient été testées, plutôt que des phrases ayant une structure différente (non grammaticale). Parce que l'apprentissage des régularités grammaticales nécessite que le nourrisson soit capable de déterminer les limites entre les mots, cela indique que les nourrissons encore très jeunes sont capables d'acquérir simultanément plusieurs niveaux de connaissances linguistiques (lexical et syntaxique), ce qui indique que l'apprentissage statistique est un mécanisme puissant. en jeu dans l'apprentissage des langues.[1][7]

Malgré le rôle important que l'apprentissage statistique semble jouer dans l'acquisition lexicale, ce n'est probablement pas le seul mécanisme par lequel les nourrissons apprennent à segmenter les mots. Les études d’apprentissage statistique sont généralement conduites avec des grammaires artificielles n’ayant pas d’indication d’information sur les limites de mots autres que les probabilités de transition entre les mots. Cependant, la parole réelle comporte de nombreux types d'indices aux limites des mots, y compris des informations prosodiques et phonotactiques.[8]

Ensemble, les résultats de ces études sur l’apprentissage statistique de l’acquisition d’une langue indiquent que les propriétés statistiques de la langue sont un indice important pour aider les nourrissons à apprendre leur première langue.[1]

Acquisition phonologique[[[[modifier]

Il existe de nombreuses preuves que l'apprentissage statistique est un élément important pour découvrir quels phonèmes sont importants pour une langue donnée et quels contrastes au sein des phonèmes sont importants.[9][10][11] Avoir cette connaissance est important pour les aspects de la perception de la parole et de la production de la parole.

Apprentissage distributionnel[[[[modifier]

Depuis la découverte des capacités d’apprentissage statistique des enfants dans l’apprentissage des mots, le même mécanisme général a également été étudié dans d’autres facettes de l’apprentissage des langues. Par exemple, il est bien établi que les enfants en bas âge peuvent discriminer entre des phonèmes de nombreuses langues différentes mais deviennent finalement incapables de distinguer entre des phonèmes qui n'apparaissent pas dans leur langue maternelle;[12] Cependant, il n'était pas clair comment cette diminution de la capacité discriminatoire s'est produite. Maye et al. suggéré que le mécanisme responsable pourrait être un mécanisme d'apprentissage statistique dans lequel les nourrissons suivent les régularités de distribution des sons dans leur langue maternelle.[12] Pour tester cette idée, Maye et al. exposé les nourrissons de 6 et 8 mois à un continuum de sons de la parole qui varie en fonction du degré d’expression. La distribution que les enfants ont entendue était soit bimodale, avec les sons des deux extrémités du continuum de voix entendus le plus souvent, soit unimodale, avec des sons du milieu de la distribution entendus le plus souvent. Les résultats ont indiqué que les nourrissons des deux groupes d'âge étaient sensibles à la distribution des phonèmes. Lors du test, les nourrissons ont entendu des expositions non alternées (exemples répétés de jetons 3 ou 6 d'un continuum à 8 jetons) ou alternées (exemples de jetons 1 et 8) à des phonèmes spécifiques du continuum. Les nourrissons exposés à la distribution bimodale ont écouté plus longtemps les essais en alternance que les essais sans alternance, sans différence de temps d'écoute pour les nourrissons exposés à la distribution unimodale. Cette découverte indique que les nourrissons exposés à la distribution bimodale étaient mieux en mesure de distinguer les sons des deux extrémités de la distribution que les nourrissons à l'état unimodal, quel que soit leur âge. Ce type d'apprentissage statistique diffère de celui utilisé dans l'acquisition lexicale, dans la mesure où il oblige les nourrissons à suivre les fréquences plutôt que les probabilités de transition et a été appelé «apprentissage distributionnel».[10]

On a également constaté que l'apprentissage distributif aidait les enfants en bas âge à opposer deux phonèmes dont ils avaient initialement du mal à faire la distinction. Maye, Weiss et Aslin ont constaté que les nourrissons exposés à une distribution bimodale d'un contraste non natif, difficile à discriminer au départ, étaient plus aptes à distinguer le contraste que les nourrissons exposés à une distribution unimodale du même contraste.[13] Maye et al. ont également constaté que les nourrissons étaient capables d’abstraire les caractéristiques d’un contraste (c.-à-d. exprimer le temps de départ) et de généraliser cette caractéristique au même type de contraste à un autre lieu d’articulation, constat qui n’a pas été trouvé chez l’adulte.

Dans une revue du rôle de l'apprentissage distributionnel sur l'acquisition phonologique, Werker et al. notons que l’apprentissage distributionnel ne peut être le seul mécanisme par lequel les catégories phonétiques sont acquises.[10] Cependant, il semble clair que ce type de mécanisme d'apprentissage statistique peut jouer un rôle dans cette compétence, même si des recherches sont en cours.[10]

Effet d'aimant perceptuel[[[[modifier]

Une découverte connexe concernant les indices statistiques de l’acquisition phonologique est un phénomène appelé effet d’aimant perceptuel.[14][15][16] En ce sens, un phonème prototypique de la langue maternelle d’une personne sert d’aimant à des phonèmes similaires, perçus comme appartenant à la même catégorie que le phonème prototypique. Dans le test initial de cet effet, les participants adultes devaient indiquer si un exemple donné d'un phonème particulier était différent d'un phonème de référence.[14] Si le phonème de référence est un phonème non prototypique pour cette langue, les bébés adultes et les nourrissons de 6 mois montrent moins de généralisation à d'autres sons que les phonèmes prototypiques, même si la distance subjective entre les sons est la même.[14][16] Autrement dit, les adultes et les nourrissons sont tous deux plus susceptibles de remarquer qu'un phonème particulier diffère du phonème de référence si ce phonème de référence est un exemple non prototypique que s'il s'agit d'un exemple prototypique. Les prototypes eux-mêmes sont apparemment découverts grâce à un processus d'apprentissage distributif, dans lequel les nourrissons sont sensibles aux fréquences avec lesquelles certains sons sont générés et traitent ceux qui surviennent le plus souvent comme des phonèmes prototypiques de leur langue.[11]

Acquisition syntaxique[[[[modifier]

Un dispositif d'apprentissage statistique a également été proposé comme composant de l'acquisition syntaxique chez les jeunes enfants.[1][9][17] Les premières preuves de ce mécanisme provenaient en grande partie d'études de modélisation informatique ou d'analyses de corpus en langage naturel.[18][19] Ces premières études portaient principalement sur l’information sur la répartition plutôt que sur les mécanismes d’apprentissage statistique. En particulier, dans ces premiers articles, il était proposé que les enfants créent des modèles de structures de phrases possibles comprenant des catégories de types de mots non nommés (par exemple, des noms ou des verbes, bien que les enfants ne placent pas ces étiquettes dans leurs catégories). On a pensé que les enfants apprenaient quels mots appartenaient aux mêmes catégories en suivant les contextes similaires dans lesquels des mots de la même catégorie apparaissent.

Des études ultérieures ont élargi ces résultats en examinant le comportement réel d'enfants ou d'adultes exposés à des grammaires artificielles.[9] Ces dernières études ont également examiné le rôle de l’apprentissage statistique plus largement que les études précédentes, en plaçant leurs résultats dans le contexte des mécanismes d’apprentissage statistique supposés être impliqués dans d’autres aspects de l’apprentissage des langues, tels que l’acquisition lexicale.

Résultats expérimentaux[[[[modifier]

Les preuves tirées d'une série de quatre expériences menées par Gomez et Gerken suggèrent que les enfants sont capables de généraliser des structures grammaticales en moins de deux minutes d'exposition à une grammaire artificielle.[9][20] Dans la première expérience, les nourrissons âgés de 11 à 12 mois ont été formés à une grammaire artificielle composée de mots non-sens dotés d'une structure grammaticale définie. Au test, les nourrissons ont entendu à la fois de nouvelles phrases grammaticales et non grammaticales. Les nourrissons sont plus orientés vers les phrases grammaticales, conformément aux recherches antérieures qui suggèrent que les nourrissons s’orientent généralement plus longtemps vers des instances de langage naturelles plutôt que vers des instances de langage modifiées, par exemple.[21] (Cette préférence en matière de familiarité diffère de la préférence en matière de nouveauté généralement observée dans les études d’apprentissage des mots, en raison des différences entre acquisition lexicale et acquisition syntaxique.) Cette découverte indique que les jeunes enfants sont sensibles à la structure grammaticale du langage même après une exposition minimale. Gomez et Gerken ont également constaté que cette sensibilité est évidente lorsque les transitions non grammaticales sont situées au milieu de la phrase (contrairement à la première expérience, dans laquelle toutes les erreurs se sont produites au début et à la fin des phrases), que les résultats ne pouvaient pas être identiques. en raison d'une préférence innée pour les phrases grammaticales causées par autre chose que la grammaire et que les enfants sont capables de généraliser les règles grammaticales à un nouveau vocabulaire.

Ensemble, ces études suggèrent que les nourrissons sont capables d'extraire une quantité substantielle de connaissances syntaxiques même après une exposition limitée à une langue.[9][20] Les enfants ont apparemment détecté des anomalies grammaticales, que la violation grammaticale dans les phrases d'essai se soit produite à la fin ou au milieu de la phrase. De plus, même lorsque les mots individuels de la grammaire ont été modifiés, les nourrissons étaient toujours capables de faire la distinction entre les chaînes grammaticales et non grammaticales au cours de la phase de test. Cette généralisation indique que les enfants en bas âge n’apprenaient pas les structures grammaticales spécifiques au vocabulaire, mais faisaient abstraction des règles générales de cette grammaire et les appliquaient au nouveau vocabulaire. En outre, dans les quatre expériences, le test des structures grammaticales a eu lieu cinq minutes après la fin de la première exposition à la grammaire artificielle, ce qui suggère que les nourrissons étaient capables de conserver les abstractions grammaticales qu'ils avaient apprises même après un court délai.

Dans une étude similaire, Saffran a constaté que les adultes et les enfants plus âgés (enfants de première et de deuxième année) étaient également sensibles aux informations syntaxiques après une exposition à une langue artificielle ne présentant aucun indice de structure de phrase autre que les régularités statistiques présentes.[22] Les adultes et les enfants ont été en mesure de choisir des phrases non-grammaticales à un taux plus élevé que le hasard, même dans des conditions d’exposition «accidentelles» dans lesquelles le principal objectif des participants était de réaliser une tâche différente tout en entendant la langue.

Bien que le nombre d’études traitant de l’apprentissage statistique d’informations syntaxiques soit limité, les données disponibles indiquent que les mécanismes d’apprentissage statistique sont probablement un facteur contribuant à la capacité des enfants à apprendre leur langue.[9][17]

Apprentissage statistique en bilinguisme[[[[modifier]

Une grande partie des premiers travaux utilisant des paradigmes d’apprentissage statistique ont été axés sur la capacité des enfants ou des adultes à apprendre une seule langue.[1] compatible avec le processus d’acquisition du langage chez les locuteurs ou apprenants monolingues. Cependant, on estime qu'environ 60 à 75% de la population mondiale est bilingue.[23] Plus récemment, des chercheurs ont commencé à examiner le rôle de l’apprentissage statistique pour ceux qui parlent plus d’une langue. Bien qu’il n’y ait pas encore de commentaires sur ce sujet, Weiss, Gerfen et Mitchel ont examiné l’incidence simultanée de l’écoute de plusieurs langues artificielles sur la capacité d’apprendre l’une ou les deux langues.[24] Au cours de quatre expériences, Weiss et al. ont constaté que, après avoir été exposés à deux langues artificielles, les apprenants adultes sont capables de déterminer les limites des mots dans les deux langues lorsque chaque langue est parlée par un locuteur différent. Cependant, lorsque les deux langues étaient parlées par le même locuteur, les participants ne pouvaient apprendre les deux langues que lorsqu'elles étaient «congruentes» – lorsque les limites de mots d'une langue correspondaient aux limites de mots de l'autre. Lorsque les langues étaient incongrues – une syllabe apparaissant au milieu d’un mot dans une langue apparaissaient à la fin du mot dans l’autre langue – et parlées par un seul locuteur, les participants étaient en mesure d’apprendre, au mieux, l’un des deux langues. Une dernière expérience a montré que l’incapacité à apprendre des langues incongrues parlées de la même manière n’était pas due à un chevauchement des syllabes entre les langues mais à des frontières de mots différentes.

Un travail similaire reproduit la conclusion selon laquelle les apprenants sont capables d’apprendre deux ensembles de représentations statistiques lorsqu’un signal supplémentaire est présent (deux voix masculines différentes dans ce cas).[25] Dans leur paradigme, les deux langues étaient présentées de manière consécutive, plutôt qu'entrelacées comme dans le paradigme de Weiss et al.[24] et les participants ont appris la première langue artificielle à laquelle ils avaient été exposés mieux que la seconde, bien que leur performance ait été supérieure à la chance pour les deux langues.

Bien que l'apprentissage statistique améliore et renforce le multilinguisme, il semble que l'inverse ne soit pas vrai. Dans une étude de Yim et Rudoy[26] il a été constaté que les enfants monolingues et bilingues effectuent les tâches d'apprentissage statistique de manière égale.

Antovich et Graf Estes [27] ont constaté que les enfants bilingues âgés de 14 mois sont plus doués que les monolingues pour segmenter deux langues artificielles différentes en utilisant des indices de probabilité de transition. Ils suggèrent qu'un environnement bilingue dans la petite enfance entraîne les enfants à compter sur des régularités statistiques pour segmenter le flux de parole et accéder à deux systèmes lexicaux.

Limites de l'apprentissage statistique[[[[modifier]

Mappage Word-Référent[[[[modifier]

Un mécanisme d'apprentissage statistique a également été proposé pour apprendre le sens des mots. Plus précisément, Yu et Smith ont mené deux études dans lesquelles des adultes ont été exposés à des images d'objets et ont entendu des mots insensés.[28] Chaque mot non-sens était associé à un objet particulier. Il y avait au total 18 paires mot-référent, et chaque participant a reçu 2, 3 ou 4 objets à la fois, selon la condition, et a entendu le mot non-sens associé à l'un de ces objets. Chaque paire de mots-références a été présentée 6 fois au cours des essais d’entraînement; Une fois les essais de formation terminés, les participants ont passé un test alternatif forcé dans lequel ils étaient invités à choisir le bon référent correspondant au mot non-sens qui leur avait été donné. Les participants ont été en mesure de choisir le bon article plus souvent que par hasard, en indiquant, selon les auteurs, qu'ils utilisaient des mécanismes d'apprentissage statistique pour suivre les probabilités de cooccurrence lors d'essais d'entraînement.

Une hypothèse alternative est que les apprenants dans ce type de tâche peuvent utiliser un mécanisme «proposer-mais-vérifier» plutôt qu'un mécanisme d'apprentissage statistique.[29][30] Medina et al. et Trueswell et al. soutiennent que, comme Yu et Smith ont suivi les connaissances uniquement à la fin de la formation, plutôt que de les suivre au cas par cas, il est impossible de savoir si les participants mettaient réellement à jour les probabilités statistiques de cooccurrence (et donc plusieurs hypothèses simultanément), ou si, au lieu de cela, ils formaient une seule hypothèse et la vérifiaient lors du prochain essai.[28][29][30] Par exemple, si un participant se voit présenter une image d'un chien et une image d'une chaussure et qu'il entend le mot absurde vash elle pourrait supposer que vash fait référence au chien. Lors d'un prochain procès, elle peut voir une image d'une chaussure et une image d'une porte et à nouveau entendre le mot vash. Si l'apprentissage statistique est le mécanisme par lequel les correspondances mot-référent sont apprises, le participant serait alors plus susceptible de choisir l'image de la chaussure que la porte, car chaussure serait apparue en conjonction avec le mot vash 100% du temps. Cependant, si les participants ne forment qu'une seule hypothèse, ils peuvent ne pas se rappeler du contexte de la présentation précédente de vash (surtout si, comme dans les conditions expérimentales, il y a plusieurs essais avec d'autres mots entre les deux présentations de vash) et donc être au hasard dans ce second procès. Selon ce mécanisme proposé d’apprentissage des mots, si le participant avait bien deviné que vash référée à la chaussure lors du premier essai, son hypothèse serait confirmée lors de l’essai suivant.

Pour distinguer ces deux possibilités, Trueswell et al. a mené une série d'expériences similaires à celles de Yu et Smith, sauf qu'il a été demandé aux participants d'indiquer leur choix de mappage mot-référent pour chaque essai et qu'un seul nom d'objet était présenté pour chaque essai (avec un nombre variable d'objets) .[28][30] Les participants auraient donc été à l’aise quand ils ont été forcés de choisir lors de leur premier procès. Les résultats des essais ultérieurs indiquent que les participants n’utilisaient pas de mécanisme d’apprentissage statistique dans ces expériences, mais utilisaient plutôt un mécanisme de proposition et de vérification, ne gardant à l’esprit qu’une hypothèse potentielle à la fois. Plus précisément, si les participants avaient choisi un mappage mot-référent incorrect dans la présentation initiale d'un mot non-sens (parmi cinq choix possibles), leur probabilité de choisir le mappage correct mot-référent lors du prochain essai de ce mot était toujours chance, ou 20%. Si, toutefois, le participant avait choisi la bonne correspondance mot-référent lors de la présentation initiale d'un mot non-sens, la probabilité de choisir la bonne correspondance mot-référent lors de la présentation suivante de ce mot était d'environ 50%. Ces résultats ont également été reproduits dans une situation où les participants choisissaient entre deux alternatives seulement. Ces résultats suggèrent que les participants ne se souvenaient pas du contexte de chaque présentation et n'utilisaient donc pas d'indices statistiques pour déterminer les correspondances mot-référent. Au lieu de cela, les participants émettent une hypothèse concernant un mappage mot-référent et, lors de la présentation suivante de ce mot, confirment ou rejettent l'hypothèse en conséquence.

Dans l’ensemble, ces résultats, ainsi que des résultats similaires à ceux de Medina et al., Indiquent que les significations des mots peuvent ne pas être apprises par un mécanisme d’apprentissage statistique dans ces expériences, qui demandent aux participants d’hypothéquer une cartographie même au premier événement (c.-à-d. situationnellement).[29] Toutefois, lorsque le mécanisme «proposer mais vérifier» a été comparé à un mécanisme d’apprentissage statistique, le premier n’a pas été en mesure de reproduire les trajectoires d’apprentissage individuelles, ni d’adapter aussi bien le second.[31]

Besoin d'interaction sociale[[[[modifier]

En outre, l’apprentissage statistique ne peut à lui seul rendre compte des aspects de l’acquisition du langage pour lesquels il a été démontré qu’il joue un rôle important. Kuhl, Tsao et Liu, par exemple, ont découvert que les jeunes enfants apprenant l'anglais qui passaient du temps en laboratoire avec une personne de langue maternelle mandarine étaient en mesure de faire la distinction entre les phonèmes qui se produisent en mandarin mais pas en anglais, contrairement aux enfants en contrôle état.[32] Les nourrissons dans cette condition de contrôle venaient au laboratoire aussi souvent que les nourrissons dans la condition expérimentale, mais n'étaient exposés qu'à l'anglais. testés à une date ultérieure, ils étaient incapables de distinguer les phonèmes mandarin. Dans une seconde expérience, les auteurs ont présenté aux nourrissons des enregistrements audio ou audiovisuels de locuteurs de mandarin et ont testé la capacité des nourrissons à distinguer les phonèmes de mandarin. Dans cette condition, les nourrissons n'ont pas réussi à distinguer les phonèmes d'une langue étrangère. Cette découverte indique que l’interaction sociale est une composante nécessaire de l’apprentissage d’une langue et que, même si les données brutes d’audition d’une langue sont présentées aux enfants, ils ne peuvent pas tirer parti des indices statistiques présents dans ces données s’ils ne sont pas également confrontés. l'interaction sociale.[11]

Généralité du domaine[[[[modifier]

Bien que le phénomène de l'apprentissage statistique ait été découvert pour la première fois dans le contexte de l'acquisition du langage et qu'il existe de nombreuses preuves de son rôle à cet effet, les travaux effectués depuis la découverte initiale suggèrent que l'apprentissage statistique peut être une compétence générale du domaine et n'est probablement pas propre à l'homme .[3][33] Par exemple, Saffran, Johnson, Aslin et Newport ont constaté que les adultes et les nourrissons étaient capables d’apprendre les probabilités statistiques de «mots» créés en jouant différentes tonalités musicales (les participants ont entendu les notes musicales D, E et F présentées ensemble formation et ont pu reconnaître ces notes comme une unité à l’essai par rapport à trois notes qui n’avaient pas été présentées ensemble).[34] Dans les domaines non auditifs, il est prouvé que les humains sont capables d’apprendre des informations visuelles statistiques si ces informations sont présentées dans l’espace, par exemple:[35] ou le temps, par exemple,.[36] Des preuves d’apprentissage statistique ont également été trouvées chez d’autres primates, par exemple[37] et des capacités d'apprentissage statistiques limitées ont été trouvées même chez des non-primates comme les rats.[38] Ensemble, ces résultats suggèrent que l’apprentissage statistique peut être un mécanisme d’apprentissage généralisé utilisé dans l’acquisition du langage, plutôt qu’un mécanisme propre à la capacité de l’enfant humain à apprendre sa / ses langue (s).

Une étude menée par le département de psychologie de l’Université de Cornell sur l’apprentissage statistique visuel dans la petite enfance a été suggérée. Les chercheurs de cette étude se sont demandé si des informations visuelles permettraient d’appréhender l’ensemble des domaines de l’apprentissage statistique. Après avoir d'abord visionné des images selon des modèles statistiquement prévisibles, les nourrissons ont ensuite été exposés aux mêmes modèles familiers en plus de nouvelles séquences des mêmes composants de stimulus identiques. L'intérêt pour les éléments visuels a été mesuré en fonction du temps passé par l'enfant à se pencher sur les stimuli auxquels les chercheurs ont appelé «regarder le temps». Tous les âges des nourrissons participants ont montré un plus grand intérêt pour la nouvelle séquence par rapport à la séquence familière. En démontrant une préférence pour les nouvelles séquences (qui violaient la probabilité transitoire qui définissait le regroupement des stimuli d'origine), les résultats de l'étude confirment la probabilité d'un apprentissage statistique général du domaine pendant l'enfance.[39]

Références[[[[modifier]

  1. ^ une b c e F g h je j k l Saffran, Jenny R. (2003). "Apprentissage statistique des langues: mécanismes et contraintes". Directions actuelles en sciences psychologiques. 12 (4): 110-114. doi: 10.1111 / 1467-8721.01243.
  2. ^ une b Brent, Michael R .; Cartwright, Timothy A. (1996). "La régularité de la distribution et les contraintes phonotactiques sont utiles pour la segmentation". Cognition. 61 (1-2): 93-125. doi: 10.1016 / S0010-0277 (96) 00719-6.
  3. ^ une b c e F g h Saffran, J.R .; Aslin, R. N .; Newport, E. L. (1996). "Apprentissage statistique chez les nourrissons de 8 mois". Science. 274 (5294): 1926-1928. doi: 10.1126 / science.274.5294.1926. PMID 8943209.
  4. ^ Saffran, Jenny R .; Newport, Elissa L .; Aslin, Richard N. (1996). "Segmentation de Word: Le Rôle des Indices de Distribution". Journal de la mémoire et du langage. 35 (4): 606–621. doi: 10.1006 / jmla.1996.0032.
  5. ^ Aslin, R. N .; Saffran, J.R .; Newport, E. L. (1998). "Calcul des statistiques de probabilité conditionnelle chez les nourrissons âgés de 8 mois". Science psychologique. 9 (4): 321–324. doi: 10.1111 / 1467-9280.00063.
  6. ^ une b Saffran, Jenny R (2001a). "Des mots dans une mer de sons: le résultat d'un apprentissage statistique précoce". Cognition. 81 (2): 149–169. doi: 10.1016 / S0010-0277 (01) 00132-9.
  7. ^ une b c Saffran, Jenny R .; Wilson, Diana P. (2003). "Des syllabes à la syntaxe: Apprentissage statistique à plusieurs niveaux par des nourrissons de 12 mois". Enfance. 4 (2): 273–284. doi: 10.1207 / S15327078IN0402_07.
  8. ^ Mattys, Sven L .; Jusczyk, Peter W .; Luce, Paul A .; Morgan, James L. (1999). "Phonotactic and Prosodic Effects on Word Segmentation in Infants". Cognitive Psychology. 38 (4): 465–494. doi:10.1006/cogp.1999.0721.
  9. ^ une b c e F Gómez, Rebecca L.; Gerken, LouAnn (2000). "Infant artificial language learning and language acquisition". Trends in Cognitive Sciences. 4 (5): 178–186. doi:10.1016/S1364-6613(00)01467-4. PMID 10782103.
  10. ^ une b c Werker, J. F.; Yeung, H. H.; Yoshida, K. A. (2012). "How Do Infants Become Experts at Native-Speech Perception?". Current Directions in Psychological Science. 21 (4): 221–226. doi:10.1177/0963721412449459.
  11. ^ une b c Kuhl, Patricia K. (2004). "Early language acquisition: cracking the speech code". Nature Reviews Neuroscience. 5 (11): 831–843. doi:10.1038/nrn1533. PMID 15496861.
  12. ^ une b Maye, Jessica; Werker, Janet F; Gerken, LouAnn (2002). "Infant sensitivity to distributional information can affect phonetic discrimination". Cognition. 82 (3): B101–B111. doi:10.1016/S0010-0277(01)00157-3.
  13. ^ Maye, Jessica; Weiss, Daniel J.; Aslin, Richard N. (2008). "Statistical phonetic learning in infants: facilitation and feature generalization". Developmental Science. 11 (1): 122–134. doi:10.1111/j.1467-7687.2007.00653.x.
  14. ^ une b c Kuhl, Patricia K. (1991). "Human adults and human infants show a "perceptual magnet effect" for the prototypes of speech categories, monkeys do not". Perception & Psychophysics. 50 (2): 93–107. doi:10.3758/BF03212211.
  15. ^ Kuhl, P. K. (2000). "A new view of language acquisition". Proceedings of the National Academy of Sciences. 97 (22): 11850–11857. doi:10.1073/pnas.97.22.11850. PMC 34178.
  16. ^ une b Kuhl, P.; Williams, K.; Lacerda, F; Stevens, K.; Lindblom, B (1992). "Linguistic experience alters phonetic perception in infants by 6 months of age". Science. 255 (5044): 606–608. doi:10.1126/science.1736364. PMID 1736364.
  17. ^ une b Seidenberg, M. S. (1997). "Language Acquisition and Use: Learning and Applying Probabilistic Constraints". Science. 275 (5306): 1599–1603. doi:10.1126/science.275.5306.1599.
  18. ^ Cartwright, Timothy A.; Brent, Michael R. (1997). "Syntactic categorization in early language acquisition: formalizing the role of distributional analysis". Cognition. 63 (2): 121–170. doi:10.1016/S0010-0277(96)00793-7.
  19. ^ Redington, M (1998). "Distributional information: A powerful cue for acquiring syntactic categories". Cognitive Science. 22 (4): 425–469. doi:10.1016/S0364-0213(99)80046-9.
  20. ^ une b Gomez, Rebecca L; Gerken, LouAnn (1999). "Artificial grammar learning by 1-year-olds leads to specific and abstract knowledge". Cognition. 70 (2): 109–135. doi:10.1016/S0010-0277(99)00003-7.
  21. ^ Hirsh-Pasek, Kathy; Kemler Nelson, Deborah G.; Jusczyk, Peter W.; Cassidy, Kimberly Wright; Druss, Benjamin; Kennedy, Lori (1987). "Clauses are perceptual units for young infants". Cognition. 26 (3): 269–286. doi:10.1016/S0010-0277(87)80002-1. ISSN 0010-0277.
  22. ^ Saffran, Jenny R. (2001b). "The Use of Predictive Dependencies in Language Learning". Journal of Memory and Language. 44 (4): 493–515. doi:10.1006/jmla.2000.2759.
  23. ^ Schneider, Harry D.; Hopp, Jenna P. (2011). "The use of the Bilingual Aphasia Test for assessment and transcranial direct current stimulation to modulate language acquisition in minimally verbal children with autism". Clinical Linguistics & Phonetics. 25 (6–7): 640–654. doi:10.3109/02699206.2011.570852.
  24. ^ une b Weiss, Daniel J.; Gerfen, Chip; Mitchel, Aaron D. (2009). "Speech Segmentation in a Simulated Bilingual Environment: A Challenge for Statistical Learning?". Language Learning and Development. 5 (1): 30–49. doi:10.1080/15475440802340101. PMC 3981102.
  25. ^ Franco, Ana; Cleeremans, Axel; Destrebecqz, Arnaud (2011). "Statistical Learning of Two Artificial Languages Presented Successively: How Conscious?". Frontiers in Psychology. 2. doi:10.3389/fpsyg.2011.00229. PMC 3177082.
  26. ^ Yim, Dongsum; Rudoy, John (August 2012). "Implicit Statistical Learning and Language Skills in Bilingual Children". Journal of Speech, Language, and Hearing Research. 56: 310–322. doi:10.1044/1092-4388(2012/11-0243).
  27. ^ Antovich, Dylan M.; Graf Estes, Katharine (January 2017). "Learning across languages: bilingual experience supports dual language statistical word segmentation". Developmental Science. doi:10.1111/desc.12548.
  28. ^ une b c Yu, C.; Smith, L. B. (2007). "Rapid Word Learning Under Uncertainty via Cross-Situational Statistics". Science psychologique. 18 (5): 414–420. doi:10.1111/j.1467-9280.2007.01915.x. PMID 17576281.
  29. ^ une b c Medina, T. N.; Snedeker, J.; Trueswell, J. C.; Gleitman, L. R. (2011). "How words can and cannot be learned by observation". Proceedings of the National Academy of Sciences. 108 (22): 9014–9019. doi:10.1073/pnas.1105040108. PMC 3107260. PMID 21576483.
  30. ^ une b c Trueswell, John C.; Medina, Tamara Nicol; Hafri, Alon; Gleitman, Lila R. (2013). "Propose but verify: Fast mapping meets cross-situational word learning". Cognitive Psychology. 66 (1): 126–156. doi:10.1016/j.cogpsych.2012.10.001. PMC 3529979. PMID 23142693.
  31. ^ Kachergis, G. N.; Yu, C.; Shiffrin, R. M. (2012). "Cross-situational word learning is better modeled by associations than hypotheses". IEEE Conference on Development and Learning / EpiRob 2012. doi:10.1109/DevLrn.2012.6400861.
  32. ^ Kuhl, P. K. (2003). "Foreign-language experience in infancy: Effects of short-term exposure and social interaction on phonetic learning". Proceedings of the National Academy of Sciences. 100 (15): 9096–9101. doi:10.1073/pnas.1532872100. PMC 166444. PMID 12861072.
  33. ^ Turk-Browne, Nicholas B.; Jungé, Justin A.; Scholl, Brian J. (1 January 2005). "The Automaticity of Visual Statistical Learning". Journal of Experimental Psychology: General. 134 (4): 552–564. doi:10.1037/0096-3445.134.4.552.
  34. ^ Saffran, Jenny R; Johnson, Elizabeth K; Aslin, Richard N; Newport, Elissa L (1999). "Statistical learning of tone sequences by human infants and adults". Cognition. 70 (1): 27–52. doi:10.1016/S0010-0277(98)00075-4.
  35. ^ Fiser, J.; Aslin, R. N. (2001). "Unsupervised Statistical Learning of Higher-Order Spatial Structures from Visual Scenes". Science psychologique. 12 (6): 499–504. doi:10.1111/1467-9280.00392.
  36. ^ Fiser, József; Aslin, Richard N. (2002). "Statistical learning of higher-order temporal structure from visual shape sequences". Journal of Experimental Psychology: Learning, Memory, and Cognition. 28 (3): 458–467. doi:10.1037/0278-7393.28.3.458.
  37. ^ Newport, Elissa L.; Hauser, Marc D.; Spaepen, Geertrui; Aslin, Richard N. (2004). "Learning at a distance II. Statistical learning of non-adjacent dependencies in a non-human primate". Cognitive Psychology. 49 (2): 85–117. doi:10.1016/j.cogpsych.2003.12.002.
  38. ^ Toro, Juan M.; Trobalón, Josep B. (2005). "Statistical computations over a speech stream in a rodent". Perception & Psychophysics. 67 (5): 867–875. doi:10.3758/BF03193539.
  39. ^ Kirkham, Natasha Z; Slemmer, Jonathan A; Johnson, Scott P (2002). "Visual statistical learning in infancy: evidence for a domain general learning mechanism". Cognition. 83 (2): B35–B42. doi:10.1016/S0010-0277(02)00004-5. ISSN 0010-0277.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *