Visualisation(s) :
3 (2 ULiège)
Téléchargement(s) :
0 (0 ULiège)
#2
Cet article présente un projet de recherche ancré autour de la question des interactions Humains-Agents Conversationnels Textuels (ACT). Dans un contexte marqué par l’intégration progressive des Intelligences Artificielles Génératives dans le domaine de l’industrie, de nouvelles questions émergent quant aux enjeux et aux impacts des usages de cette technologie sur et pour les opérateurs et leurs activités. Ces problématiques soulèvent un nouveau besoin d’adaptation des méthodologies de recherche face aux singularités de l’objet d’étude. Par le biais d’une proposition de projet axé sur le soutien aux activités de conception d’ACT pour des activités d’Ingénierie Système, ce document étudie les apports d’une approche ergonomique mixte d’analyse de l’activité pour l’étude des interactions Humains-ACT (IH-ACT) en contexte industriel. Une attention particulière est également portée aux intérêts de l’usage d’une démarche compréhensive dans l’appréhension d’une technologie centrée sur la tâche. Ce papier constitue un préquel à l’étude proposée.
Développées à partir des années 1950, les systèmes d’Intelligence Artificielle (IA), outre le domaine d’étude qu’ils représentent (McCarthy, 2007), peuvent être définis comme un « ensemble d’algorithmes, de systèmes informatiques, de machines et plus largement de technologies sous différentes formes (logiciels, robotiques, etc.) qui s’inspirent de, ou visent à, imiter des facultés humaines comme la perception, la production et la compréhension du langage naturel, la représentation des connaissances, ou encore le raisonnement » (Gamkrelidze, 2022, p.22). Développés dans les années 1960, les modèles d’IA connexionnistes ont connu une croissance significative depuis 2012, résultant dans le développement des systèmes de neurones actuellement utilisés sous la forme de réseaux de neurones multicouches. Ces modèles sont à l’origine de l’avènement des Grands Modèles de Langage (Large Language Models, LLM), des « systèmes d'intelligence artificielle de pointe conçus pour traiter et générer du texte, visant à communiquer de manière cohérente » (Naveed et al., 2023, p.1). Dernières formes de leur évolution mises en lumière depuis l’année 2023, les IA Générative (IAGen), sont présentées comme des systèmes d’IA capables de produire un « contenu nouveau et diversifié, dans différents formats, et pour diverses tâches, en exploitant des modèles génératifs » (García-Peñalvo et Vázquez-Ingelmo, 2023, p.8). Ces derniers développements ont notamment été intégrés au sein de systèmes d’agents conversationnels (AC), caractérisés comme des systèmes numériques capables d’une certaine autonomie auprès de l’environnement dans lequel ils évoluent (Jennings et Wooldridge, 1998). Ils disposent de capacités d’interactions avec l’utilisateur par des moyens de communications et de perceptions non-verbaux ou verbaux, domaine spécifiquement attribué aux agents conversationnels textuels (ACT).
Parallèlement à leur intégration dans de nombreuses disciplines, ces technologies se sont notamment développées dans les registres de l’Ingénierie Système (IS), définie par l’INCOSE (International Council on Systems Engineering) comme « Une approche transdisciplinaire et intégrative pour permettre la réalisation, l'utilisation et la mise hors service de systèmes conçus, en utilisant des principes et des concepts systémiques, ainsi que des méthodes scientifiques, technologiques et de gestion » (Sillitto et al., 2019, p.3). Néanmoins, en dépit de la littérature scientifique spécialisée dans l’étude des AC et ACT au sein de l’IS (voir 2.2), les études démontrent un manque de compréhension des phénomènes observés en contexte expérimental. Ces constats ont développé une volonté de rapprochement des observations vers des terrains d’étude écologiques (Rapp et al., 2023). Par-delà l’ambition d’accès au réel de l’activité se superpose à l’émergence de nouvelles critiques concernant la littérature existante sur les interactions humain-IA. Sur ce point, certains auteurs classent les approches actuelles comme "technocentriques" et mettent en lumière les défis de l'acceptation de la technologie du point de vue des utilisateurs, notamment dans le cadre de contextes professionnels, tels que pour l’activité de retranscription écrite de comptes-rendus (Gamkrelidze, 2022). Ces préoccupations soutenues, d’une part, par un renforcement du lien au terrain et, d’autre part, par une plus grande implication des utilisateurs finaux dans les études des ACT, sont à l’origine de la présente proposition méthodologique de recherche. Cette étude aura pour objectif d’adopter une approche compréhensive des IH-ACT dans un cadre professionnel pour des tâches d’IS. Ceci à des fins d’élaboration de recommandations de conception et d’usage d’ACT spécialisé. La démarche développée est ancrée dans le registre des Interactions Homme-Machine (IHM) mêlé aux méthodes et aux outils de l’analyse de l’activité définies autour de l’étude de la prescription et du réel de l’activité. A cette fin, le terme d’interaction sera ici compris comme le phénomène de « deux entités qui déterminent mutuellement leurs comportements. En IHM, ces entités sont les ordinateurs (allant des appareils d’entrées aux systèmes) et des humains (allant de l’opérateur à l’utilisateur de l’outil) » (traduit de Hornbaek et Oulasvirtra, 2017, p.11).
Pour faire avancer la réflexion sur le sujet, la suite de l’article s’attachera à étudier les mécanismes de genèse des IH-ACT selon les étapes suivantes : une brève revue de la littérature sur le sujet sera d’abord présentée (1), suivie de la problématique sous-jacente portée par cette dernière (2). Afin d’y répondre, une proposition d’approche méthodologique sera évoquée (3) ainsi que les principaux résultats attendus à la fin de cette étude (4). Une conclusion dressera ensuite le constat du statut actuel du projet (5).
Sujet polysémique aux multiples visages, les interactions, ou l’interaction en tant qu’objet, présentent différentes définitions selon les domaines d’études mobilisés, provoquant des divergences quant à l’objet même d’étude. Compte tenu de ce caractère polymorphe, ce travail se référa au processus d’interaction tel qu’étudié par Hornbaek et Oulasvirta (2017) dans le registre des IHM. Les auteurs proposent une première classification des différents « concepts » d’interactions abordés au sein de la littérature, ceux-ci pouvant être catégorisés par des interactions de dialogue (i.e., cycles de communications et de leurs interprétations), des interactions de transmission (i.e., l’envoi d’un message d’un émetteur par le biais d’un canal brouillé), des interactions comportementales (i.e., l’adaptation des comportements aux caractéristiques de la tâche, de la technologie et de l’opérateur), des interactions d’usage d’outils (i.e., l’usage humain d’outils pour interagir avec les environnements) , des interactions incarnées (i.e., agir et appartenir dans un environnement social et matériel), des interactions d’expérience (i.e., un flux continu d’attentes, de ressentis et de souvenirs) ou des interactions de contrôle (i.e., des essais de régulation des erreurs au travers de modèles de référence).
En raison de leurs caractères hautement personnalisables associés aux performances offertes par les IAGen, les ACT se distinguent comme une nouvelle ressource venant soutenir les besoins des activités réalisées en IS. De fait, les demandes adressées par les activités en IS sont caractérisées par leurs tâches de modélisation, de simulation, de caractérisation et de visualisation de systèmes complexes (e.g., système aérospatial). Compte tenu de cette complexité, les activités sont associées à des besoins de soutien à la collaboration, d’aide à la visualisation des composantes et des relations des systèmes, de l’assurance de modélisations hautement fidèles et de soutien quant aux capacités de raisonnement face aux systèmes étudiés (Beihoff et al., 2014), expliquant le nouvel attrait porté sur les opportunités proposées par les ACT. Leurs intégrations au sein des activités de travail en IS s’expriment notamment sous différentes modalités d’interactions, majoritairement segmentées dans trois principaux domaines d’action :
L’architecture système : comme observé par Ahmad et al. (2023), les ACT semblent présenter une ressource dans la conception d’architecture système par leurs capacités de génération de code et de réalisation de synthèses de multiples sources d’informations. Les auteurs y relèvent un usage itératif de l’ACT, fondé sur la réalisation de tâches de conception, d’analyse et d’évaluation des productions dans une activité d’Ingénierie d’Architecture, les tâches étant réparties entre l’ACT et les utilisateurs du système.
La définition d’exigences (Ronanki et al., 2023) : présentée comme l’activité de structuration des fonctions (i.e. ; ce que le système doit faire), des niveaux de performance attendus, des contraintes associées pour le système étudié et son environnement », cette notion est ici tournée vers l’élaboration d’exigences définies comme des « déclarations qui traduisent ou expriment un besoin et les contraintes et conditions qui lui sont associées » (ISO/IEC/IEEE 29148:2018(E)). Cette dimension clé pour l’IS est ici utilisée pour comparer les performances génératives de ChatGPT 3.5 à celles d’experts métiers. En regardant leurs capacités de respect des critères de qualité préalablement identifiés, l’article illustre les capacités des ACT dans l’amélioration de la compréhensibilité et de la constance des exigences réalisées, dépassant les scores des experts en ces points (M=7.6 sur 10 pour ChatGPT, M=7 sur 10 pour les experts).
La formation des ingénieurs (Maladzhi, 2023) : sujets d’intérêt pour de multiples disciplines, les IH-ACT sont ici présentées sous l’angle de dimensions techniques et éthiques, où les ACT sont représentés comme vecteurs d’engagement et sources de guidage omniprésentes, quoi que restant soumis à certaines remises en question de leur réel bénéfice. Ces questions s’illustrent notamment dans le développement d’un état passif de l’opérateur également exposé lors de l’expansion des processus d’automatisation (Sambasivan et Veeraraghavan, 2022). Néanmoins, ces premières études ne permettent pas de définir précisément les implications des ACT dans les enjeux spécifiques de l’éducation à l’ingénierie.
Outre ces domaines, les agents non-conversationnels et AC ont été un objet d’étude privilégié dans les activités de simulation (Yilmaz et Ören, 2009) avant de connaître un récent intérêt pour leurs usages, en tant qu’ACT dans les processus de modélisation (Qasse et al., 2021).
L’énumération de ces différents sujets d’étude démontre un intérêt pour ces systèmes dans des pratiques nécessitant de multiples vues d’une même activité et à forte prédominance cognitive. Néanmoins, ces recherches restent essentiellement centrées sur les aspects performatifs de l’ACT dans une vision de techno-push, sans chercher à analyser les raisons ayant mené à ces états.
En dépit de l’investigation progressive de ce thème de recherche, les approches scientifiques en IS démontrent à ce jour des difficultés à l’élaboration de recherches pluridisciplinaires sur les ACT, malgré leur intérêt croissant dans l’usage de méthodologies issues des sciences humaines et sociales. Par ailleurs, ces recherches ne permettent pas d’exposer clairement les interactions prenant place entre l’humain et le système. L’absence d’analyse des interactions effectuées semble ainsi renvoyer à une vision réductrice de l’activité, uniquement permise par l’addition d’un opérateur à un système. Pour autant, il a depuis longtemps été démontré l’existence de phénomènes dynamiques entre ces deux entités, qui aboutissent à la production de l’activité (e.g., Engeström, 1987). La compréhension de ces phénomènes est d’autant plus importante dans les activités d’IS qui visent à concevoir et représenter ces interactions, leurs conditions et leurs résultats entre chaque composante du système. Telles que présentées en IS, les interactions avec les ACT favorisent la compréhension et la génération de différentes formes de supports de données fournies ou demandées par les utilisateurs (Frazier et al., 2022). Cette caractéristique soutient le développement d’interactions conversationnelles engageantes, propices aux apprentissages (Leibrandt, 2002). Les connaissances et les compétences manipulées par les ACT sont également source de réduction des interactions multimodales des utilisateurs dans leurs accès aux diverses bases de données, au profil d’une unique interface de dialogue (Ross et al., 2023). De fait, l’usage d’ACT intrigue et attire pour ses promesses d’interactions anthropomorphiques qui permettraient un accès rapide et personnalisé aux différentes données stockées à des échelles locales ou mondiales. Le mythe de l’ACT illustre la volonté d’instantanéité, d’interconnexion, d’automatisation et de fusion symbiotique entre l’humain et la machine. Or ce dernier point évoque la question d’interactions « naturelles » pour lesquelles l’humain n’aurait plus à réaliser d’effort pour traduire ses processus mentaux en message compréhensible par le système technologique utilisé. Face à cette construction sociale, les premières études mentionnées restent donc bien loin des spéculations médiatiques entourant les IAGen. Néanmoins, la littérature scientifique en IS reste encore dans une phase exploratoire du sujet. Ce phénomène est explicable par la temporalité de déploiement de ces technologies, encore peu intégrées dans les milieux industriels. Ainsi, l’IS présente de nombreuses opportunités de recherche dans ce domaine, que cela soit pour l’approfondissement des apports de la technologie et de la compréhension des phénomènes sous-jacents pour des activités d’architecture système, la caractérisation des opportunités des ACT dans des processus d’apprentissage d’IS, ou l’observation des mécanismes interactionnels associés aux différentes performances relevées dans la conception d’exigences.
En raison de cette abondance de sujets, les recherches citées semblent privilégier une analyse a posteriori des interactions avec l’ACT. Pour autant, ces comportements se construisent et évoluent avant même la réalisation de l’action (e.g., Frazier et al., 2022). La compréhension de ces différents mécanismes, principalement attribués à l’identification de modèles mentaux sert alors de repère aux activités de conception. De fait, le travail de conception tel que réalisé par les ingénieurs représente une forte activité de représentation mentale. Dans leur processus de planification des usages réalisés par les utilisateurs finaux, les concepteurs font fréquemment appel à l'usage de simulations dans lesquelles sont encouragées les projections des logiques d'usages des futurs utilisateurs, dans un objectif de "tracer la logique de conception" (Darses et al., 2001, p.18). Dans ce contexte, l’insertion d’un nouvel outil de travail dans le quotidien de l’opérateur est perçue comme un potentiel vecteur d’évolution de ses représentations de l’activité. Pour autant, cette dimension ne semble encore que peu intégrée dans les recherches portées sur les nouvelles générations d'ACT. Dans le cadre de l’IS, cette dimension est d’autant plus prévalente comme élément de structuration des systèmes représentés. En effet, l’ingénieur se doit de concevoir les systèmes selon les besoins opérationnels et techniques exprimés par la demande, en comprenant et anticipant les différentes formes d’usages associés. En Ergonomie, ces processus sont notamment déterminés par la conception et l’intégration d’images opératives représentatives du regard porté par un opérateur sur les caractéristiques de son activité (Ochanine, 1969). À cet égard, les images opératives peuvent être définies comme « des structures informationnelles spécialisées qui se forment au cours de telle ou telle action dirigée sur des objets » (Ochanine & Koslov, 1971, p.1). Les auteurs distinguent à leur sujet deux formes distinctes : les images opératives afférentes, associées à la production de représentations permettant de définir les différents statuts pris par l’objet, et les images opératives effectrices, marquées par la sélection et la planification des activités à réaliser sur l’objet. Sous cet angle, l’intégration de systèmes d’ACT poserait de la question de son rôle structurant dans la construction des représentations mentales des systèmes manipulés, autant que dans la propre représentation de l’ingénieur de l’activité en cours de réalisation.
Afin de contribuer à une meilleure compréhension des enjeux d'usages des ACT pour les utilisateurs finaux dans un contexte de leur conception, cette étude tentera de répondre à la question de recherche suivante : Quels sont les déterminants et impacts des représentations de l'ACT intégré dans l'activité réalisée sur les stratégies opératoires des opérateurs, pour des tâches d'Ingénierie Système ?
Afin de cerner les composantes sociotechniques et cognitives de l’activité d’IS impliquant des IH-ACT, cette recherche pose ses fondements dans les modèles de théorie de l’activité, tels que proposés par Engeström (1987) et Leontiev (1974), en poursuivant toutefois leurs extensions aux observations de la théorie située développée par Suchman (1987). Ces choix théoriques favorisent ainsi l’intégration des enjeux des ACT dans une perspective d’outil de l’activité, intégré dans un environnement complexe allant au-delà des questions sociales ou technologiques précédemment étudiées par la littérature spécialisée. De fait, la théorie de l’activité, telle que proposée par Engeström (1987), repose sur la conceptualisation d’interactions entre un sujet, l’opérateur, et les composantes de son activité, à comprendre les règles, organisations, instruments, communautés et objets constituant son environnement. Ce modèle s’inscrit en complément de la classification réalisée par Leontiev (1974), qui décompose l’activité en un ensemble d’actions elles-mêmes construites par la réalisation d’opérations. Ici, les activités sont alors définies comme des « processus structurés par une représentation mutuelle des buts à atteindre (i.e., des actions), associés à des buts », les opérations étant alors considérées comme des comportements effectués dans la réalisation d’une action. Par l’intermédiaire de son livre « Plans and Situated Actions », Suchman (1987) développe une nouvelle grille d’analyse des communications humain-machine, ici illustrées par des interactions entre des opérateurs et un photocopieur. Sous cette approche, les interactions prennent la forme d’échanges verbaux qui incarnent le point de rencontre entre l’humain et son environnement. Ces échanges sont alors perçus comme le produit des représentations de l’activité réalisées par l’opérateur et imputées à la machine sous forme de clés d’actions procédurales. Ainsi, malgré leurs prises en compte communes des influences du milieu écologique dans la construction des activités, ces théories diffèrent par leur niveau d’analyse : le modèle de Suchman étant afférant à un niveau individuel, dont l’unité d’analyse est représentée par l’interaction, au contraire de celui d’Engeström s’attachant davantage au micro et exo système, comme conceptualisés par Brofenbrenner (1979).
Pour identifier ses dimensions applicatives, cette recherche s'intéresse à poursuivre les premiers travaux effectués dans un contexte d'architecture système (voir 2.2). Cette activité est caractérisée par son approche transversale de sujets techniques dans un objectif de conception de systèmes complexes nécessitant l'intégration de multiple sous-système. De fait, l'architecte système, en tant qu’ingénieur spécialisé dans la définition et la conception de l’architecture d’un système, doit accorder une multiplicité de regards quant aux exigences et besoins associés au même produit. Il dispose de sources d'informations variées principalement constituées par les parties prenantes du projet, les organisations en charge du développement du produit, l'environnement technique et l'expérience personnelle du concepteur (Bass et al., 2003). À ce titre, l'activité d'architecture intervient dans les premières phases de conception, faisant la jonction avec la manipulation de dimensions abstraites, lesquelles sont par la suite spécifiées au sein d'un système concret. Le travail de l'architecte système est caractérisé par la mobilisation de compétences collaboratives et la capacité de négociation entre les points de vue des différents acteurs (e.g., utilisateur, acquéreur, architecte, chef de programme, service qualité, marketing, …). Il doit également être en possession de nombreuses compétences communicationnelles, jonglant entre les besoins de synthèses des architectures présentées à l'équipe de façon claire et compréhensible, à ceux orientés autour de la bonne compréhension et de l'écoute attentive des informations émises par les différents partis. D'un point de vue technique, l'architecte système se doit de disposer d'une bonne compréhension des différents systèmes et de leurs interactions selon leurs niveaux d'abstraction. Son activité est orientée vers une actualisation constante de ses informations au sujet des technologies émergentes permettant la justification de choix de conception, fabrication et certification, tout en disposant de capacités de genèse d'exigences indisponibles dans d'autres types de documents formalisés (Bass et al., 2003).
D'un point de vue procédural, il est attendu des architectes système de pouvoir effectuer des cycles de formalisation des données récoltées auprès des différentes sources précédemment exposées. La pratique d’architecture système ne disposant pas de mise en œuvre standardisée, les pratiques divergent selon les lieux et secteurs de l’activité. Dans le secteur de l’aéronautique concerné par la présente recherche, ces démarches peuvent notamment être représentées par le cadre d’architecture MOFLT (Mission, Operational, Functional, Logical, Technical) proposée par le groupe Airbus (Figure 1). L’architecture est ainsi conçue par la succession d’étapes d’analyse des futures missions du système, puis de ses différents scénarios d’utilisation, appelée analyse opérationnelle. La construction de cet espace nommé « espace problème » en raison de sa spécification de la demande permet la transition dans un espace dit « de solution » axé sur la structuration des capacités fonctionnelles, logiques puis techniques du système. En dépit de l’apparente linéarité de la démarche, les ingénieurs doivent fréquemment réaliser des allers-retours entre les différentes phases. Cette activité peut également s’avérer être segmentée sur de longues temporalités, allant de plusieurs mois à plusieurs années, tout en impliquant une pluralité d’acteurs prenant part. Ses caractéristiques, en incluant la manipulation de données pouvant être confidentielles, soulèvent alors un questionnement majeur dans la construction du recueil de données afférant à l’activité, notamment dans l’étude de processus dynamiques tels que la construction d’images opératives.
Figure 1 : L'activité d'architecture d’un système avec le cadre MOFLT (adapté de De Sousa et al., 2022)
Afin d’établir la méthodologie propre au recueil puis à l’analyse des données, la réflexion doit être axée au travers de l’objet d’étude sélectionné : ici les images opératives construites par l’opérateur a priori pour un usage professionnel de l’ACT. À cet égard, deux questions méthodologiques se posent : 1) Comment recueillir les images opératives des opérateurs en contexte d’activité réelle ? Et 2) Comment observer les impacts de ces images opératives sur les interactions comportementales et expérientielles des opérateurs envers l’ACT mobilisé ?
Pour tenter d’y répondre, un premier regard peut être porté sur la littérature évoquant les méthodes de recueil des activités cognitives en contexte dynamique. À ce sujet, les travaux d’Amalberti et Hoc (1998) ressortent par leur prise en compte des questions cognitivo-écologiques, leurs travaux permettant de répondre en partie aux contraintes posées par le recueil d’une matière dynamique, intangible et incertaine. A contrario, le choix d’autres modèles tels que ceux de la cognition incorporée (Wilson, 2002) limitent la compréhension de la complexité de l’environnement et de son influence sur l’usage de la technologie. De fait, les premiers auteurs cités préconisent un recueil de données porté sur la documentation et les artefacts des précédentes interventions ayant eu trait à l’activité observée. Cette première phase peut être enrichie d’entretiens exploratoires et d’observations dites « ouvertes » car non déterminées à un objet précis de l’activité. Au travers de cette pratique, le chercheur souhaite accéder à l’historique de l’activité, pour connaître son contexte, ses différents événements et ses évolutions. Son objectif est également de relever et d’identifier des premiers états ou comportements, ainsi que des données verbales ou non-verbales indiquant le positionnement de l’opérateur quant à son activité. Pour la phase d’analyse, Rapp et al. (2023) proposent l’usage d’une méthodologie inductive pour l’observation du développement des stratégies « collaboratives » entre les participants et un agent conversationnel textuel dans un contexte d’activité réelle. À cette fin, l’étude démontre l’intérêt d’usage de la théorie ancrée dans la construction du matériel de codage et d’analyse depuis le matériel récolté. Par ailleurs, selon les indications portées par Ochanine (1969), les images opératives peuvent être retrouvées au sein des projections associées au déroulement de l’action, puis au sein de l’action effective, avant de finir par leurs intégrations au sein des processus de traitement des signaux perçus au cours et à la suite de l’action. En tant qu’ensemble constitutif de l’activité, ces éléments sont caractérisés comme persistant et faiblement affectés par la modification des tâches.
Figure 2 : Modélisation de la méthode IBIS (traduite de Hashim, 1991,p.286)
Les représentations des opérateurs pourraient alors être observées sous la forme de dimensions récurrentes déplacées sur divers aspects des activités. Ainsi, les images opératives peuvent être étudiées lors des phases de planification, de réalisation et d’évaluation de l’action, au travers de l’observation des réactions au changement et par le biais de comptes-rendus graphiques et verbaux réalisés par l’opérateur. À ce titre, l'analyse des protocoles verbaux, comme exprimés au travers des conversations humains-ACT, retrace également les diverses informations constitutives des images afférentes et effectrices. Parmi les méthodes couramment utilisées dans la modélisation de l'information au sein d'un dialogue, la méthode IBIS (Issue-Based Information System) pourrait servir d’inspiration pour sa sensibilité d'approche des raisonnements sous-jacents à la constitution puis l'utilisation de stratégies opératives. Concrétisée par Fischer et al. (1991), cette méthode permet l'étude des mécanismes d'interactions entre les arguments, positions, et enjeux du discours (Figure 2). Ces points constitueraient une approche partielle des structures sémantiques utilisées par l’opérateur, les arguments et positions reflétant la structuration des connaissances utilisées pour interagir avec l’ACT, tandis que les enjeux du discours illustreraient la finalité poursuivie. Néanmoins, cette approche nécessiterait d’être complétée par l’intégration de la perception de l’environnement écologique par l’opérateur (Ochanine, 1969).
En complément de l’extraction des images opératives précédemment évoquées, cette seconde problématique soulève le manque d’inclusion des possibles articulations entre les différentes représentations finalisées, qui se mueraient alors en stratégies opératoires. Dans leurs rôles de caractériser l’activité de l’opérateur de son propre regard, ses images sont amenées à être assemblées, fragmentées et déplacées pour continuellement s’adapter aux caractéristiques évolutives de l’environnement de l’opérateur. Afin d’observer les impacts de ces dimensions, il convient donc de pouvoir les formaliser en les capturant dans leurs différents déroulements et dans les étapes clé du processus. L’activité observée disposant d’une temporalité morcelée, cette dimension d’échantillonnage s’exprime comme un point crucial pour la démarche à adopter. Sa récolte est alors dépendante de l’identification des différents temps de l’activité et des enjeux associés, portés par les divers acteurs environnant l’activité. Pour ce faire, la tenue d’entretiens exploratoires auprès des différentes instances relevées (opérateurs, responsables) pourra être planifiée. Les données récoltées au cours de la première phase d’étude pourront être catégorisées puis analysées sous leur forme de cours d’action. Exposé par Theureau et Filippi (1994), ce concept réfère à l'analyse des données sous forme de chroniques de l’activité et de leurs temps significatifs (perçus par l’opérateur) qui deviennent des « récits réduits » de ces moments. À cette fin, l'auteur préconise l'usage de trois méthodes d'analyse : la méthode « analytico – régressive » (un découpage en unité d’action en partant d’un état de l’action et en demandant les étapes pour parvenir à sa réalisation), la méthode « synthetico progressive » (un résumé des unités d’action et des étapes qui les ont fait passer à la suivante), puis la méthode "comparative" (une confrontation des deux résultats). Ces analyses rendent compte de l’activité perçue, tout en permettant l’analyse à différents niveaux de fonctions et de modalités. Les informations ainsi extraites permettront de modéliser l’activité dans ses enjeux et spécificités exprimés selon les divers objectifs des acteurs interviewés, desquels pourront être échantillonnées les tâches à observer. Néanmoins, ces données resteront insuffisantes pour une réelle compréhension des stratégies opératoires et de leurs principaux facteurs. En effet, la faiblesse de cette approche s’illustre par son manque de formalisme ne permettant pas de représenter concrètement les chronologies d’activité étudiées. Pour parer à cette absence, de multiples méthodes d’analyse fonctionnelle et cognitives de l’activité peuvent être envisagées. Néanmoins, dans un souci de récupération des images opératives développées par l’opérateur, une méthode ressort en particulier : la Méthode Analytique de Description des tâches (MAD). Initialement conçue par Scapin et Pierret (1989), la MAD permet une modélisation hiérarchisée des composantes (internes et externes) de l’activité ainsi que de leurs interactions. Cette méthode vise à recueillir une description des tâches encodées selon leurs natures (simples ou composées), reliées par des opérateurs (parallèle, séquence, boucle, alternative), et définies par des attributs valués (nom de la tâche, état initial, état final, but, préconditions, postconditions, corps). Par son itération dans des situations initialement dépourvues d’ACT puis dans les temps d’intégration de la technologie au sein des processus de travail, l’usage de cette méthode d’analyse permettra d’identifier les redondances ou divergences des stratégies opératoires prescrites (documentation), redéfinies (entretiens) et réalisées (observations) pour des situations avec et sans ACT.
Par la nature de l'objet d'étude (i.e. les images opératives) étudié dans son agencement avec l'intégration de nouvelles technologies d'IAGen (i.e.; l'ACT), plusieurs résultats peuvent être escomptés pour la question de recherche soulevée : Quels sont les déterminants et impacts des représentations de l'ACT intégré dans l'activité réalisée sur les stratégies opératoires des opérateurs, pour des tâches d'Ingénierie Système (IS) ?
Dans un premier temps, en se raccordant avec la définition des déterminants des images opératives telles qu'exposées par Ochanine et Koslov (1971), il est à supposer que la construction de ces représentations finalisées serait fortement déterminée par les contraintes et caractéristiques perçues de l'activité par l'opérateur. Sur ce point, les diverses perceptions et fonctionnalités attribuées aux ACT par l'étude de McComb et al. (2023) constituent un paradigme intéressant. En effet, d'après les mêmes auteurs, les connaissances préalables des opérateurs envers les fonctionnalités de l'ACT (orienté vers la résolution de problèmes, vers le soutien au développement de processus opérationnels, réactifs ou proactifs), induiraient des usages distincts de ces mêmes agents. Ces résultats impliquent une nouvelle formalisation de l'activité telle que réalisée avec la technologie, modifiant de fait ses objectifs selon les applications réalisées par l'ACT. Or, cette évolution de la représentation de la situation est également perçue comme constituante des images opératives (Ochanine, 1977). Ainsi, en raison de leurs naissances dans l'entre deux de l'action, ces images ne seraient plus essentiellement construites par l'activité observée, comme exposées par l’auteur, mais bien par les connaissances envers les capacités du nouveau système intégré (McComb et al., 2023). Néanmoins, ces deux facteurs ne disposeraient que peu d'influence dans l'élaboration des images opératives afférentes du fait du caractère génératif de l'ACT.
À cet égard, les impacts envisagés seraient que les opérateurs présenteraient de plus fortes incertitudes quant aux états produits par l'usage de l'ACT, focalisant le processus de planification de l'action vers la structuration de l'opération (i.e., les stratégies opératoires), davantage que dans sa propre gestion. Cet état serait également à l'origine d'une redéfinition des buts accentuée lors de l'interaction avec l'ACT, l'opérateur redéfinissant ses objectifs selon les apports et statuts remontés par l'agent (Ochanine, 1977). Autre impact suggéré, la structuration d'images opératives structurées selon l'intégration de capacités de coopération ou collaboration humaines (Bratman, 1992), induiraient une première phase de découverte de la technologie associée à un engagement envers l'ACT renforcé de la part de l'opérateur. Cette situation serait notamment du fait de la projection de ces interactions anthropomorphiques (Laban et Araujo, 2019). Les opérateurs imputant des capacités de perception du contexte et de l'environnement accrues par l'agent, ils présenteraient alors moins d'attention envers l'élaboration d'un contexte partagé, ce qui tendrait à réduire la construction d'un référentiel commun. Ces actions entraîneraient la nécessité d'un renforcement des interactions davantage exploratoires et marquées par un accroissement de l'insatisfaction au cours de la construction chaotique de ce référentiel (Rapp et al., 2023). Pour autant, l'expertise métier permettrait l'élaboration d'images opératives afférentes indépendantes des productions des ACT. Par leurs niveaux de détails, elles seraient propices au processus d'analyse et de récupération des erreurs ou blocages rencontrés par un renforcement des guidages émis envers l'ACT (Falzon et Darses, 1992). Dans un contexte d'architecture système, le déploiement d'images opératives incertaines et non interactives, associées à une méconnaissance des informations nécessaires à la réalisation de l'activité ou à l'usage de l'ACT, entraînerait une dépendance envers le système, particulièrement dans la phase de formalisation des architectures pour laquelle la mobilisation d'informations relatives au fonctionnement et interactions des sous-systèmes et de leurs capacités émergentes est attendue. Cette étape étant essentiellement conceptuelle et ne disposant que de peu d'opportunité d'expérimentations empiriques relatives au terrain, l'opérateur doit alors s'appuyer sur les différentes sources d'informations à sa disposition pour réaliser l'activité, l'ACT présentant pour ce cas un rôle clé de ciblage et de proposition de synthèse de ces multiples contenus. En opposition, l'usage d'images opératives claires et interactionnistes orienterait un emploi davantage opportuniste de l'ACT, principalement dans des tâches de vérification et de validation des architectures au cours des différentes étapes de l'activité (voir 4.3). L'objectif serait alors de confronter les propositions ainsi réalisées à d'autres architectures envisageables selon l'importance de l'espace de solution laissé au cours du processus (Vinchon et al., 2022).
Au regard des dimensions du projet proposé, l'étude des IH-ACT apparaît comme un vaste sujet encore peu exploré dans le registre de l'Ingénierie Système. Pour autant, de récentes études commencent à remonter le besoin d'une démarche davantage compréhensive et longitudinale, laissant entrevoir l'opportunité de se référer aux méthodologies des sciences humaines et sociales ayant amplement contribué au développement des approches qualitatives de terrain. Ainsi, malgré l'apparente difficulté de pouvoir développer des formalismes méthodologiques généralisables à tous types de terrain, l’observation des ACT semble être envisageable grâce aux moyens méthodologiques ethnographiques et expérimentaux, replaçant l'opérateur au centre des préoccupations de conception. Dans un contexte d'étude de la place des images opératives dans les IH-ACT, l'intégration de méthodes d'analyse conversationnelle mêlées aux protocoles couramment utilisés dans l'étude de l'activité en Ergonomie se présentent comme des ressources prometteuses pour le recueil et l'analyse de ces données. Néanmoins, ces actions restent contraintes par l’accès au terrain qui peut être rendu complexe dans des contextes industriels, pour des questions de confidentialité et d’accessibilité aux opérateurs souhaités. Ainsi, l’intervention au sein d’entreprises est-elle dépendante de l’engagement des participants et de leur hiérarchie dans la démarche d’investigation proposée, des comportements de rejets pouvant alors compromettre la prise de relevés. À la question de recherche posée concernant les potentiels facteurs et impacts des images opératives sur les stratégies opératoires mobilisées lors des IH-ACT, des postulats sont émis quant aux apports des ACT dans la redéfinition des contextes de création et d'évolution des images opératives. Ces suppositions laissent ainsi à envisager de nouveaux regards à porter sur les technologies génératives, notamment concernant la pertinence des outils actuels utilisés pour leur étude, de même que la poursuite des réflexions concernant la capacité de transposition de ces interactions aux référentiels communément utilisés dans le registre des interactions humains-humains pour la même activité. L'ouverture de telles études permettrait une meilleure compréhension des facteurs élaborés a priori de l'action des opérateurs, offrant une meilleure appréhension des critères de conception des ACT du point de vue des concepteurs.
Ahmad, A., Waseem, M., Liang, P., Fehmideh, M., Aktar, M. S., & Mikkonen, T. (2023). Towards Human-Bot Collaborative Software Architecting with ChatGPT (arXiv:2302.14600). arXiv. http://arxiv.org/abs/2302.14600
Amalberti, R., & Hoc, J.-M. (1998). Analyse des activités cognitives en situation dynamique : Pour quels buts ? Comment ? Le Travail Humain, 61(3), 209‑234.
Bass, L., Clements, P., C., & Kazman, R. (2003). Software Architecture in Practice.
Beihoff, B., (2014) A World in Motion–Systems Engineering Vision 2025. INCOSE-SE Leading Indicators Guide 2014.
Bratman, M. E. (1992). Shared Cooperative Activity.
Bronfenbrenner, U., 1979. The Ecology of Human Development. Harvard University Press.
Darses, F., Détienne, F., & Visser, W. (2001). Assister la conception : Perspectives pour la psychologie cognitive ergonomique. EPIQUE 2001, Journées d'étude en Psychologie ergonomique, Nantes, France, 29-30 Octobre 2001.
De Sousa, J., Faudou, R., & Dahl, I. (2022, 28 avril). Application of MBSE to reverse-engineer OPS-SAT and prepare future IOD missions (including OPS-SAT2) [Diapositives ; PowerPoint]. https://nebula.esa.int/sites/default/files/neb_study/2614/C4000134652FP.pdf
Engeström, Y. (1987). Learning by Expanding : An Activity-Theoretical Approach to Developmental Research (2e éd.). Cambridge University Press. https://doi.org/10.1017/CBO9781139814744
Falzon, P., & Darses, F. (1992). Les processus de coopération dans des dialogues d’assistance. Communication présentée au XXVII e Congrès de la SELF, Lille, septembre.
Fischer, G., Lemke, A.C., McCall, R., and Morch, A.I. (1991), Making Argumentation Serve Design. Human-Computer Interaction, 6, 393–419
Frazier, M., Kumar, S., Damevski, K., & Pollock, L. (2022). Investigating User Perceptions of Conversational Agents for Software-related Exploratory Web Search. Dans Proceedings of the ACM/IEEE 44th International Conference on Software Engineering: New Ideas and Emerging Results (ICSE-NIER '22). Association for Computing Machinery, New York, NY, USA, 51–55.
Gamkrelidze, T. (2022). Des discours aux réalités de la conception, du déploiement et des usages des systèmes d’Intelligence Artificielle dans les situations de travail.
García-Peñalvo, F., & Vázquez-Ingelmo, A. (2023). What Do We Mean by GenAI? A Systematic Mapping of The Evolution, Trends, and Techniques Involved in Generative AI. International Journal of Interactive Multimedia and Artificial Intelligence, 8(4), 7. https://doi.org/10.9781/ijimai.2023.07.006
Hornbæk, K., & Oulasvirta, A. (2017). What Is Interaction? Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems, 5040‑5052. https://doi.org/10.1145/3025453.3025765
Jennings, N. R., & Wooldridge, M. (1998). Applications of intelligent agents. Agent technology: foundations, applications, and markets, 3-28
Laban, G., & Araujo, T. (2019). Working Together with Conversational Agents: The Relationship of Perceived Cooperation with Service Performance Evaluations. Lecture Notes in Computer Science. https://doi.org/10.1007/978-3-030-39540-7_15
Leibrandt, R. P. (2002). Systems Engineering Support Using an Embodied Conversational Agent: Can a Virtual Instructor/Mentor Really Provide Learning Support to Students, Faculty and Practitioners? INCOSE International Symposium, 12(1), 516‑519. https://doi.org/10.1002/j.2334-5837.2002.tb02504.x
Leontiev A. 1974, The problem of activity in psychoIogy. Soviet Psychology, 13,4-33
Maladzhi, R. W., Tsoeu, M., Mthombeni, N., Moloi, K., Mashifana, T., & Nemavhola, F. (2023). How important are Chatbots within Engineering Education? A literature-based review from 2011 to 2023. 2023 World Engineering Education Forum - Global Engineering Deans Council (WEEF-GEDC), 1‑5. https://doi.org/10.1109/WEEF-GEDC59520.2023.10344203
McCarthy, J. (2007). What is Artificial Intelligence. http://jmc.stanford.edu/articles/whatisai/whatisai.pdf
McComb, C., Boatwright, P., & Cagan, J. (2023). Focus and modality : defining a roadmap to future ai-human teaming in design. Proceedings of the Design Society, 3, 1905‑1914. https://doi.org/10.1017/pds.2023.191
Naveed, H., Khan, A. U., Qiu, S., Saqib, M., Anwar, S., Usman, M., Akhtar, N., Barnes, N., & Mian, A. (2023). A Comprehensive Overview of Large Language Models (arXiv:2307.06435). arXiv. http://arxiv.org/abs/2307.06435
Ochanine, D. (1969). Rôle de l’image opérative dans la saisie du contenu informationnel des signaux. Questions de Psychologie, 4. https://doi.org/10.4000/pistes.4660
Ochanine, D. A. (1977). Concept of operative image in engineering and general psychologie. Dans V. F. R. V. F. V. B.F. Lomov (Ed.), Engineering psychology. Moscow: Science Publisher.
Ochanine, D. A., & Koslov, V. (1971). L'image opérative effectrice. Question de Psychologie, 3.
Qasse, I., Mishra, S., & Hamdaqa, M. (2021). Chat2Code : Towards conversational concrete syntax for model specification and code generation, the case of smart contracts (arXiv:2112.11101). arXiv. http://arxiv.org/abs/2112.11101
Rapp, A., Curti, L., & Boldi, A. (2021). The human side of human-chatbot interaction: A systematic literature review of ten years of research on text-based chatbots. International Journal of Human-Computer Studies, 151, 102630. https://doi.org/10.1016/j.ijhcs.2021.102630
Ronanki, K., Berger, C., & Horkoff, J. (2023). Investigating ChatGPT’s Potential to Assist in Requirements Elicitation Processes (arXiv:2307.07381). arXiv. http://arxiv.org/abs/2307.07381
Ross, S. I., Martinez, F., Houde, S., Muller, M., & Weisz, J. D. (2023). The Programmer’s Assistant: Conversational Interaction with a Large Language Model for Software Development. Proceedings of the 28th International Conference on Intelligent User Interfaces, 491‑514. https://doi.org/10.1145/3581641.3584037
Sambasivan, N., et Veeraraghavan, R. (2022). The Deskilling of Domain Expertise in AI Development. In CHI Conference on Human Factors in Computing Systems. 1–14.
Scapin, D., Pierret-Golbreich, C. (1989) Towards a Method for Task Description: MAD. In Berlinguet, L., Berthelette, D. (eds.), Proceedings of Work with Display Units WWU’89, Elsevier Science Publishers, (189) 27–34
Sillitto, H., Martin, J., McKinney, D., Griego, R., Dori, D., Krob, D., Godfrey, P., Arnold, E., & Jackson, S. (2019). System Definition, System Worldviews, and Systemness Characteristics. IEEE Systems Journal, 1-11. 10.1109/JSYST.2019.2904116.
Suchman, L. A. (1987). Plans and situated actions: The problem of human-machine communication. Cambridge University Press.
Theureau, J., & Filippi, G. (1994). Cours d’action et conception d’un système d’aide à la coordination : Le cas de la régulation du trafic du RER. Sociologie du travail, 36(4), 547‑562. https://doi.org/10.3406/sotra.1994.2194
Vinchon, F., Lubart, T., Bartolotta, S., Gironnay, V., Botella, M., Bourgeois-Bougrine, S., Burkhardt, J., Bonnardel, N., Corazza, G. E., Glăveanu, V., Hanchett Hanson, M., Ivcevic, Z., Karwowski, M., Kaufman, J. C., Okada, T., Reiter‐Palmon, R., & Gaggioli, A. (2023). Artificial Intelligence & Creativity : A Manifesto for Collaboration. The Journal of Creative Behavior, jocb.597. https://doi.org/10.1002/jocb.597
White, J., Fu, Q., Hays, S., Sandborn, M., Olea, C., Gilbert, H., Elnashar, A., Spencer-Smith, J., & Schmidt, D. C. (2023). A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT (arXiv:2302.11382). arXiv. http://arxiv.org/abs/2302.11382
Xu, W. (2019). Toward human-centered AI: A perspective from human-computer interaction. Interactions, 26(4), 42‑46. https://doi.org/10.1145/3328485
Wilson, M. (2002). Six views of embodied cognition. Psychonomic Bulletin & Review, 9(4), 625‑636. https://doi.org/10.3758/BF03196322
Yilmaz, L., & Ören, T. I. (Éds.). (2009). Agent-directed simulation and systems engineering. Wiley-VCH.
Emilie PERREAU, Romain PINQUIÉ et Cédric MASCLET, « Proposition d’une méthodologie de recherche pour l’étude des interactions humains-agent conversationnel textuel en milieu écologique : application pour des tâches d’Ingénierie Système. », ModACT [En ligne], | 2024, document 2, mis en ligne le 10 septembre 2024, consulté le 23 février 2025. URL : http://popups.uliege.be/3041-4687/index.php?id=148
Univ. Grenoble Alpes, CNRS, Grenoble, INP, G-SCOP, Grenoble, France