Gledhill Christopher. 1997. Les Collocations et la construction du savoir scientifique. Anglais de Spécialité 15/18. 85-
Les collocations et la construction du savoir
Chris GLEDHILL Résumé.
We claim here that collocation constitutes an essential process in the construction of scientific ideas. While corpus analysis in lexicography has established the importance of idiom in the language as a whole (Sinclair 1991), less attention has been paid to the analysis of phraseology in specialist texts outside the world of terminology. We examine here the phraseology of two grammatical items and two lexical items in 150 cancer texts and set out their changing collocational patterns thoughout the research article genre. We find that phraseology has a pervasive role to play in the argumentation and scientific validity of the text. The pervasive regularity of these expressions remain largely unknown to the writers who use them, suggesting that domain specialisation in language is a largely subconscious phenomenon. At the same time, phraseology gives coherence to the community’s means of expression and allows for a backdrop against which new expressions may be contrasted. We emphasise the role of phraseology in the discourse community, its role in the textual development of ideas and its possible ‘genetic’ function in the evolution of scientific discourse.
Key words: collocation, phraseology, reformulation, corpus linguistics, discourse of science.
Mots clés: collocation, phraséologie, reformulation, linguistique de corpus, discours de la science.
1 Introduction.
Et pour l’apprenant d’une langue de spécialité et pour le néophyte d’une discipline
scientifique quelconque, il est de mise de pouvoir entrer sans difficulté dans le
discours de la communauté des spécialistes. Ce problème a été abordé de façon
différente selon les traditions. Par exemple, il existe quantité d’études
linguistiques sur la rhétorique du discours spécialisé, par exemple sur la structure
rhétorique des articles spécialisés (Swales 1990, Nwogu 1989), la reformulation et
la vulgarisation (Harvey 1995) ou le discours de l’évaluation (Thomson et Yiyun
1991). De même, les études terminologiques ont su exploiter l’analyse des corpus
informatisés pour quantifier le lexique spécialisé (Knowles 1997) et pour suivre la
création de néologismes dans les nouvelles sciences (Pavel 1993, Kokourek et
Rousseau 1992). Si les ces approches abordent le même problème de plusieurs
optiques différentes, les processus d’apprentissage des structures discursives, et le
rapport entre ces structures et les propriétés lexicales du discours scientifique
Certaines études ont déjà mis en application des descriptions détaillées basées sur
des corpus importants. Kreztenbacher (1991) a étudié l’ensemble des
caratéristiques grammaticales d’un corpus d’Abstracts. Salager-Meyer (1994) et
Hyland (1994) ont exploité des ensembles importants de textes pour examiner la
modalité phrastique (le hedging) dans l’anglais académique. De même Williams
(1996) a démontré l’utilité de l’ordinateur dans l’analyse des contextes de certains
verbes de l’anglais médical. Mais en général, les études socio-rhétoriques n’ont
pas encore exploité la notion de collocation ou de phraséologie dans leurs
analyses. De même, les terminologues n’ont pas encore exploité les notions
linguistiques de développement textuel et contextuel dans leur méthodologie.
Dans cet article nous proposons donc de combiner l’approche relativement
systématique élaborée par les terminologues avec l’approche contextuelle de
l’analyse du discours. Ainsi notre but est de démontrer le rôle discursif de la
phraséologie dans le discours spécialisé et de rendre compte que la phraséologie
occupe une place aussi importante dans l’apprentissage des langues de spécialité
2 La collocation dans les textes spécialisés.
C’est dans l’analyse du contexte que l’ordinateur nous permet d’aller bien au-delà
des premières analyses de texte. Dans l’élaboration de dictionnaires de langue
générale, Sinclair (1991) a démontré que les propriétés globales du langage nous
sont pour la plupart cachées et qu’une analyse totale d’un échantillon représentatif
de la langue rend compte du rôle primordial du lexique dans la structuration des
phrases et dans la différentiation des lexèmes. Le principe ‘idiomatique’ de
Sinclair affirme que le mot n’est aucunement sélectionné dans le vide mais
dépend d’une structure syntagmatique plus importante. Le principe s’applique
autant aux ‘collocations’, des mots qui se combinent seulement dans certains
contextes (par ex. ‘auburn hair’, ‘bras ballants’) qu’à des ensembles qui dépassent
les limites phrastiques traditionnelles. Par exemple, en français journalistique
chaque occurrence de l’expression circonstancielle ‘pour_s’en_convaincre’ est
introduite exclusivement par ‘il_suffit’ (le signe _ indique un lexème fixe):
1 Il_suffit de consulter les parents pour_s’en_convaincre. 2 Il_suffit d’observer l’oisiveté, l’égoïsme et le gaspillage de certains pour_s’en_convaincre … 3 …, Il_suffit_pour_s’en_convaincre, de rapeller que … l’économie française avait détruit (comme disent les experts) des emplois par centaines de milliers. (4 Secundo, on rapellera que les enfants et les animaux sont très largement utilisés par la publicité – la contemplation d’un écran suffit pour_s’en_convaincre.) (5 Il n’était que de voir l’embarras visible du secrétire au trésor interrogé le 24 janvier à l’occasion d’un magazine télévisé pour_s’en_convaincre.)
Ces extraits, tirés d’un corpus du Monde d’environ 1 000 000 mots (Gledhill, à
paraître), et même les quelques exceptions (dont 4 et 5), illustrent l’emploi très
régulier d’expressions redondantes ou ‘pré-fabriquées’ qui servent à orienter le
discours et à rendre la proposition symmétrique du point de vue syntactique. La
phrase ‘pour s’en convaincre’ n’est pas strictement obligatoire du point de vue
syntactique mais elle fonctionne comme une ‘locution’ dans le sens où elle fait
partie d’un ensemble lexical unitaire, bien que séparé structuralement du
syntagme verbal. Nous ne considérons pas l’expression comme un ensemble
sémantique mais plutôt un ensemble qui joue un rôle rhétorique bien précis.
Le terme ‘phraséologie’ est souvent utilisé pour recouvrir non seulement des
collocations de base qui sont simplement des mots reliés comme sans pour autant, en somme, not to mention, just in case (des locutions et des expressions figées:
Gross 1996) mais aussi les chaînes lexicales qui impliquent des continuations
assez longues, telles the fact that, for the very simple reason that, c’est pour ça que, c’est là où… souvent évoquées par les termes ‘formule’ ou ‘groupement
discursif’ (Mochet 1997). Makkai (1992) a remarqué que ces ensembles sont
beaucoup plus courants dans la langue que les idiotismes traditionnels. La
phraséologie n’est donc pas comparable aux niveaux lexicaux ou syntaxiques
mais appartient au système des expressions d’une communauté: un élément
fondamental de la rhétorique. Avant la montée des corpus informatisés, Yorio
(1980) et Pawley et Syder (1983) avaient préconisé l’analyse des expressions
figées chez les apprenants de langues étrangères pour explorer ce qu’ils
considéraient être un phénomène fondamental de la compétence linguistique. Plus
récemment, Granger (1996) a souligné l’importance de l’identification de ces
ensembles et les difficultés que ces expressions présentent aux apprenants.
L’exploitation d’un corpus s’impose donc pour l’analyse de la langue de
3 Le corpus spécialisé.
Un corpus spécialisé consiste en un ensemble de textes qui représentent soit le
même registre communicatif, soit le même domaine thématique. En effet, le
corpus spécialisé s’avère peut-être plus cohérent que le corpus de la langue
générale parce qu’il est lié très facilement à un contexte spécifique. Poutant, pour
bien exploiter le corpus spécialisé, il faut le relier à sa communauté. Avant
d’aborder la construction du corpus nous avons consulté quinze cancérologues (à
l’université d’Aston en Angleterre) afin d’établir une base de données qui révèle
les intérêts de ce groupe du point de vue local et institutionnel mais aussi du cadre
scientifique global dans lequel il se situe, car ces chercheurs ont des buts
différents et appartiennent à des communautés diverses. Le corpus constitue donc
un ensemble de textes recueillis suivant trois dimensons textuelles:
1 Cohésion interne: il faut représenter les textes produits par le groupe de quinze
experts. Nous avons ainsi recueilli dix textes (certains chercheurs publiaient leurs
textes en équipe). Ces textes variaient entre les plus généraux (de Nature etTrends in Pharmaceutical Science aux plus spécialisés: Tetrahedron Letters. Trois
textes étaient publiés dans le Journal of Chemistry: Perkin Transactions, pour des
raisons historiques liées aux préférences de publication de certains individus.
2 Cohésion externe: il faut représenter les textes auxquels les scientifiques sont
exposés: que ce soient les textes qu’ils lisent ou les textes qui se réfèrenent à leur
recherche. Les scientifiques nous ont indiqué les articles qu’il considéraient
proches à leur propres recherches et les articles qui les avaient cités. (Ce procédé
nous a fourni 50 textes, dont les périodiques les plus courants sont
Carcinogenesis, et Cancer Chemotherapy and Pharmacology).
3 Cohérence globale: il faut aussi représenter le non-dit, les textes et les
périodiques préstigieux qui traitent du cancer mais qui ne font pas référence aux
intérêts bien particuliers des quinze experts. (Ainsi nous avons sélectionnés 90
textes de divers périodiques très prestigieux qui traitent le cancer ou l’oncogénèse:
par exemple: International Journal of Cancer et le British Medical Journal).
Le corpus entier se compose donc de vingt-deux périodiques, 150 textes, 500 000
mots (nous employons le sigle PSC: Pharmaceutical Sciences Corpus). Cette
approche heuristique présente plusieurs avantages. Le PSC ne représente pas une
communauté institutionnelle, mais réflète la variété de lecture possible d’une telle
communauté. Le corpus touche à la communauté discursive globale (y compris les
textes les plus prestigieux sur le cancer) sans se concentrer sur une maladie ou un
thème en particulier (des textes parlent de l’étiologie, du traitement régional des
patients, des guérisons non-conventionnelles, de la chimie structurale et
organique…). Le plus important des avantages est que nous pouvions consulter
les auteurs directement, découvrant les buts spécifiques de leurs textes et les liens
entre leur travaux et les tendances globales de la recherche cancérologique. De
plus, les chercheurs les plus expérimentés assuraient la rédaction de périodiques
très prestigieux, et ils avaient des remarques pertinentes quant au langage et à la
phraséologie qu’on trouvait dans leur propores productions.
Le résultat est que nous avons à la fois un corpus cohérent, un discours particulier,
lié à une époque particulière mais qui représente une variété de spécialismes qui
font référence au cancer. Par exemple, un jeune chercheur se disait ‘cancérologue’
seulement dans le sens où ses recherches allaient se révéler pertinentes à un
ensemble de maladies génétiques. Ses textes sont aussi importants que les textes
des base sur le cancer: encore plus si nous considérons qu’aucun des textes n’est
proprement dit ‘à propos du cancer’. En plus, le cancer est un ensemble de
maladies pour lesquelles les chercheurs mêmes avaient des définitions biens
différentes par rapport à leurs spécialismes. Nous avons donc constitué un corpus
qui se définit par rapport à la référence au cancer, et donc à un ensemble
d’activités de recherche, et non par rapport à la maldie même.
4 Exploitation du corpus.
Pour aborder le corpus de façon systématique, nous avons identifié les
caractéristiques spécifiques de chaque section de l’article spécialisé. Nous avons
séparé chaque section (Titre, Abstract, Introduction, Méthodes, Résultats,
Discussion) et employé le logiciel Wordlist (Johns - Scott 1994) pour comparer le
lexique d’une section par rapport au corpus entier. Ceci nous indique les mots les
plus statistiquement ‘saillants’. Pour démontrer une analyse possible du corpus,
nous comparons l’emploi de deux mots grammaticaux (une préposition /
complémenteur, ‘to’, un pronom / déterminat ‘this’) et deux termes lexicaux
(patient et effect). ‘To’ est significativement fréquent dans les Introductions et les
Discussions, et nous l’analysons en tant que mot grammatical qui fait ressortir les
tendances phraséologiques, sémantiques et rhétoriques du corpus. Par contre,
‘this’ s’avère très significatif dans les Abstracts et les Discussions, et nous
l’utilisons pour démontrer la reformulation des idées. Les deux termes lexicaux
représentent les deux dimensions sémantiques fondamentales du corpus:
l’orientation technique et clinique par rapport à l’orientation empirique et
4.1 La phraséologie d’un mot grammatical typique: ‘to’.
Tout mot grammatical dans le corpus révèle une phraséologie plus restreinte que
l’ensemble de ses emplois dans la langue générale. En comparant avec les emplois
classés dans le dictionnaires Collins-Cobuild (Sinclair 1991) nous trouvons qu’en
général les mots grammaticaux les plus fréquents retiennent moins d’un tiers de
leurs emplois dans le corpus (Gledhill 1995).
Hormis les locutions figées (according to, in addition to) ‘to’ ne garde pas son
rôle de préposition classique dans le corpus. Plus généralement, il est impliqué
dans des propositions complétives, telles it is important to, have been found to, are designed to qui sont fréquentes dans les Introductions tandis que les
complétives en ‘that’ (The possibility that, it has been found that) se trouvent plus
dans les Abstracts et les Discussions. En général, on peut accorder une fonction
active aux expressions complétives en ‘to’ et une fonction ‘abstraite’ aux
expressions en ‘that’, ce qui semble établir une différence rhétorique de base
entre l’Introduction et le reste du corpus. Dans les Introductions on trouve par
exemple des explications en ‘known_to’, ce qui s’exprime plutôt par ‘It is known
Cells are known to bind p53 chemicals are known to cause embryotoxicity enzymes inhibit hepatic MFO activity hydrolysis is known to proceed via a 2-step reaction proteins are known to repair the 6-0 methylguanine
A la différence de ‘known_to’, l’expression ‘appears_to’ s’emploie toujours dans
des contextes négatifs, souvent avec une proposition subordonnée qui condredit la
Although the regulation of MyoD1 is not fully understood, this appears to perform critical functions. However, the function of p52. doesnot appear to stimulate DNA synthesis directly. Many tumours appear to have no relation to DNT oncogenic viruses However, this appears to contradict some of our preliminary observations. It appears to be an ubiquitous protein, although there is no correlation.
Ces occurrences démontrent que les Introductions ne tendent pas à exprimer la
modalité directement et que loin d’être simplement ‘modale’ l’expression ‘appears
to’ enclenche une phraséologie plus longue qui implique la comparaison et la
contradiction d’observations empiriques.
Comme nous l’avons souligné plus haut, dans toute la phrasélogie du corpus, une
distinction sémantique s’établit: l’orientation de recherche (centrée sur
l’expression de la recherche même ou de son organisation empirique) et
l’orientation technique (centrée sur les procédés biochimiques ou cliniques). Par
exemple, l’ensemble able_to permet l’expression des possibilités de recherche (à
noter: les verbes qui décrivent l’active participation des chercheurs en italique):
able to give a definitive statement
able to identify the structural defects
Quand il s’agit de sujets biochimiques par contre, les verbes complétifs
correspondent à des termes techniques, ayant un rapport avec des procédés
able to induce an immune response
the most potent of these is not able to maintain cAK III The.analogous tumor was als able to metastasize.
Ayant admis cette distinction de base, on note qu’elle s’applique parfois de façon
étonnante. Par exemple, dans l’expression ‘lead_to’, la forme au passé (led_to) se
réserve exclusivement aux sujets orientés à la recherche:
led to widespread use of hormonal aspects.
led to the investigation of radioimmunization.
led to the selection of a battery of immune assays.
Tandis que l’orientation biochimique s’exprime uniquement au présent (leads_to):
leads to increased conversion of the lactase
leads to inhibition of intracellular concentrations
leads to degradation extracelluar matrix (ECM)
Cette distinction selon le temps verbal s’accorde partiellement avec une
conception du présent comme ‘temps de l’explication’ et le passé comme ‘temps
de l’action scientifique’, mais ne s’accorde pas avec d’autres verbes dans notre
corpus, comme nous le verrons plus bas. D’ailleurs nous trouvons une distinction
similaire avec les passifs dans les Méthodes, mais non pas avec les passifs
ailleurs. Il semble que le temps dépend en partie d’une phrasélogie liée à certaines
Enfin, la phraséologie la plus importante de ‘to’ dans les Introductions concerne
sa collocation avec ‘was’ pour exprimer les buts de l’article. La variété des
expressions possibles mérite qu’on en cite plusieurs:
The aim of this study was to compare The intention was to determine One further goal was to evaluate The key to the plan was to examine Therefore our second objective was to expand data Our purpose was to explore whether Another goal of these studies was to identify DNA adducers The aim of the present series of these studies was to investigate The goal of this study was to re-evaluate A main task was to study whether Thus, the first aim of the present study was to test… The purpose of the Bristol 3rd stage trail was to use a new model… The purpose of this work was to widen the research window. The purpose of the current report was to *generate and trap*.
On peut noter que l’ensemble ‘was_to’ n’est pas classée comme constituente
classique, et pourtant cette expression constitue le seul élément constant dans ces
expressions. Si le seul critère d’identification des lexèmes collocatifs réside dans
la cooccrrence, nous sommes tenus de considérer ‘was_to’ comme forme figée.
Les autres ingrédients, tels l’expression des buts, de l’importance ou l’époque
associée à cette tâche forment un ensemble d’expressions quasi-prévisiblent qui
enclenchent le noyau ‘was_to’. Nous avons donc affaire à une ‘cascade
collocative’, un engrenage collectif de phrases.
Si le noyau de l’expression est fixe, l’expression des buts de la recherche même
peut se varier très largement jusqu’à des formules du type ‘verbe dé-lexicalisé’:
widen the research window, use a new model. Une exception se présente pourtant:
‘generate and trap’, ce qui ressemble à un procédé clinique ou biochimique.
Cette exception s’avère particulièrement intéressante: elle prouve qu’on peut
s’exprimer autrement. En fait il n’y a pas de raision que l’on ne puisse employer
l’expression ‘the aim …was_to’ + expression clinique / biochimique. Mais la
prépondérance de l’expression de procédés de recherche nous indique que la
phraséologie se fixe autour d’un éventail sémantique limité. Il faut aussi
considérer la dimension rhétorique: il se trouve que dans les Introductions, on
préfère l’expression des buts en tant qu’objectifs de recherche nouveaux plutôt
que de nouvelles méthodologies ou des détails de procédés biochimiques.
4.2 ‘This’ et la reformulation textuelle.
Si l’emploi de ‘to’ dans le corpus nous démontre les spécificités phraséologiques
de certaines sections rhétoriques, la phraséologie de ‘this’ dans le corpus nous
permet d’explorer un autre domaine textel: celui de la reformulation. D’abord
l’emploi du mot implique toujours une référence anaphorique. Nous voyons que
cette référence s’opère sur le plan des deux grandes dimensions sémantiques
évoquées plus haut. Par exemple, avec des substantifs qui reformulent des
résultats, la préposition ‘this’ se combine toujours avec ‘in’:
Par contre, chez les substantifs qui reformulent des groupes d’observations plutôt
que des résultats globaux, on note l’emploi consistant de la préposition ‘of’:
Cette liste omet pourtant le mot lexical le plus employé comme reformulateur:
‘effect’. ‘Effect’ est unique puisqu’il peut se référer autant à des entités ou
processus biochmiques qu’à des observations empiriques. Comme les mots dans
les exemples qui précèdent, ‘effect’ englobe les concepts auxquels il se réfère tout
en les classifiant en tant que phénomènes observables et mesurables (en français: une motion… –> cet effet, une réaction… -> cet effet). On peut ainsi considérer
qu’il s’agit d’un remodelage des résultats entrepris par l’auteur. En analysant le
contexte, on trouve que ‘effect’ s’emploie dans une phraséologie pluis large
permettant une évaluation ou un commentaire sur les résultats de la recherche tout
en y rajoutant de nouvelles observations, comme dans les exemples qui suivent:
#1 The increased liver weight was reversible. #2 This effect could be the result of increased intracellular glycogens #1 Treatment with 8-chloro cAMP drastically reduces R1 levels. #2 This effect is even more pronounced in MCF LOA cells #1 LUMO gap is correlated with downward shift. #2 This effect is misleading. However, some shifts are involved. #1 Both approaches resulted in 80% inhibition. #2 This effect on ECM degradation indicates that cell UPA is much more efficient.
#1 EFF cells grew slightly faster in MEM. #2 This effect was independent of oestrogens.
Par contre ‘this_result’ reformule les résultats de façon explicite en les comparant
directement avec l’hypothèse spécifique de chaque article. A la différence de la
phraséologie en ‘effect’, les expressions qui suivent ‘this result’ expliquent la
signification des résultats sans ajouter des observations empiriques nouvelles:
#1 DNA sequencing of the melanoma revealed that p53 codons. were wild type. #2 This result eliminates the possibility that mutations are germline.it suggests a mutagenic mechanism. #1 We observe several large AJ-IX positive mRNAs #2 This result may indicate that AJ-IX is a very distant exon. #1 90% of the carbonium ion was trapped and #2 this result suggests that inorganic phosphate can compete with water to trap the ion. #1 The reaction. produces MeOArc. #2 This result is consistent with the partitioning of a common intermediate. #1 The study . produced a 23 response rate #2 but we have not been able to reproduce this result.
Il faut remarquer que ces phraséologies ne peuvent pas fonctionner sans qu’il y ait
à l’arrière-plan un développement textuel particulièrement compliqué. Par
exemple, dans un texte sur la chimie structurale, le terme ‘synthèse totale’ est
introduite dans le titre comme le thème principal de l’article: (il s’agit d’une
réaction destinée à convertir toutes les constituantes chimiques engangées dans la
Titre: …Total synthesis of d4T.
Cette idée est élaborée dans un syntagme nominal plus long dans l’Abstract dans
lequel on rajoute de l’informaton à propos des fonctions de la composante
chimique, mais où le sens de la ‘synthèse’ est toujours conservée:
Abstract: The total synthesis of the antiviral agent d4T…
Dans l’Introduction, le terme synthesis est décomposé et reformulé de façon
verbale, là où les auteurs ont besoin d’expliquer les procédés spécifiques de leur
Introduction: …no synthesis to date has commenced from the non-chiral pool materials… We now report that X alcohol can also be elaborated in six steps to the anti-HIV agent d4T.
Ensuite dans les Méthodes, la synthèse est reformulée de façon verbale différente:
Méthodes: … Deacetylation was effected [=réalisée]] in quantitative yields by treatment with ammonia to provide d4T.
Dans les Résultats nous constatons les premiers emplois de ‘this’, dans son rôle
classique. Ici le procédé chimique est reformulé en employant un néologisme
‘route’. A noter aussi que cet emploi se réfère au processus en employant un
verbe spécifique introduit dans les Méthodes: ‘provides’.
Résultats: Thisroute thus provides an anomeric mixture of d4T.
Finalement, c’est dans la Discussion que la reformulation explicite intervient dans
presque chaque phrase. D’abord le procédé originel est ré-introduit, puis il est
reformulé en tant que ‘méthodologie’ et ensuite par un terme encore plus confiant
Discussion: … this total synthesis… establishes this methodology as a general and versatile strategy.
Nous constatons qu’à partir d’un seul énoncé, en l’occurrence ‘this’, nous
sommes capables d’identifier des processus de création, de décomposition et et de
reconstitution des concepts à l’intérieur des textes scientifiques. La reformulation
n’est donc pas seulement la substitution d’un mot par un autre mais une trame
textuelle destinée avec une direction et une phraséoilogie bien définie, au moins
dans les textes d’exposition scientifique. Ce processus est tout aussi évident dans
les phraséologies associées aux mots grammaticaux qu’aux mots lexicaux.
4.3 ‘Patients’ et ‘Effect’: la phraséologie des mots lexicaux.
Nous avons proposé que la distribution particulière des mots grammaticaux relève
du fait que la phraséologie est bien marquée pour chaque section de l’article. Cette
variation stylistique est d’autant plus remarquable chez les mots lexicaux. Nous
avons aussi suggéré que certains mots font ressortir les grandes tendances
rhétoriques du texte. Pour tenter de faire un analyse équilibrée entre mots
granmmaticaux et mots lexicaux, nous avons repris les contextes les plus typiques
de deux mots particuliers: patients et effect. Leur distribution est mieux visualisée
quand on les compare avec des mots de sémantique similaire (patients, cancer:
mots de désignation ‘clinique, biochimique’, ‘cause / effect’ mots de désignation
Des concordances sélectives sont présentées dans les Appendices pour démontrer
les collocations les plus significatives des deux mots pour chaque section de
l’article. Dans le texte qui suit, nous résumons les tendances globales et les
altérnances d’emploi de ces mots lors de chaque section.
Les patients ne figurent presque pas dans les titres. Dans les Abstracts par contre,
le mot est très présent et on remarque une phraséologie bien particulière. Les
patients sont modifiés par des propositions relatives (en ‘who’) qui introduisent
des expressions actives où les patients ‘reçoivent’ ou ‘participent’ à des
expériences. Cette phraséologie révèle une tendance globale du texte scientifique:
on ne donne pas des drogues aux patients, on ne les observe pas directement. A la
place, c’est aux patients de ‘souffrir’, ‘témoigner de la stabilité’ ou ‘démontrer
une bonne progression’. Les patients ‘ont’ des caractéristiques que les chercheurs
ont remarquées, mais l’expression de cette observation n’est jamais employée
dans ce contexte. Par contre, dans les Introductions, cette phraséologie devient
moins importante et on emploie des expressions figées mais plus longues:
‘phénomène X in patients with maladie Y’. Dans les Méthodes, une phraséolgoie
différente s’établit. Il s’agit de deux configurations particulières: les patients ne
sont plus des sujets de verbes actifs mais de verbes passifs. Il s’agit de procédés
empiriques pour la plupart: ils sont classifiés, exclus de certains groupes, guéris
(etc). La seconde phraséologie des Méthodes rend les patients plus actifs encore:
ils ‘reçoivent’ ou ‘répondent’ encore à certains traitements. L’emploi du verbe
‘exhibit’ (=témoigner de) y est particulièrement marqué. Pour dix expressions du
genre ‘receive drug X’ nous n’y retrouvons qu’un du type passif ‘were given drug
Dans les Résultats, les expressions s’orientent autour de trois nouvelles
phraséologies, toutes impliquées dans la quantification des résultats: le ‘nombre’
de patients observés, une phraséologie figée autour de ‘in (une quantité)
patients_treated at’ (un dosage particulier) et finalement une nouvelle version de
‘patients qui reçoivent’ mais au participe présent (+observation) ‘in patients
receiving (drug X)’. Finalement, les patients sont moins actifs dans les
Discussions, où le mot sert à classifier des ensembles qui thématisent les
innovations ou applications des articles (management, survival, cancer growth) au
lieu des drogues ou des maladies. La variation de la phraséologie dans le corpus
suggère, comme pour d’autres mots que nous avons examinés, que ces formes
sont exploitées pour des raisons rhétoriques variables.
Le mot ‘effect’ présente deux tendances globales dans le texte, bien qu’il s’agisse
d’un des mots lexicaux les plus fréquents et les plus complexes du corpus. En
général, le terme est impliqué dans la construction de syntagmes nominaux en ‘of’
(l’effet de) et en ‘on’ (l’effet sur). Mais cet emploi diminue dans les sections
ultérieures de l’article par rapport au rôle reformulateur ‘this effect’, que nous
avons évoqué plus haut. Exceptionellement, le mot s’emploie aussi dans le même
sense que ‘affect’ (il s’agit d’un verbe terminologisé pour exprimer la mise en
application d’un procédé chimique: Deacetylation was effected in quantitative
Dans les Abstracts l’expression normale des ‘effects’ témoigne de la tendance à
discuter des effets ‘anti-cancer’ de certaines drogues. Sa première forme consiste
en sone occurrence avec en ‘of’ (anti-tumour, growth-inhibitory effect of…(drogue X)), et on voit que l’effet est déjà considéré comme établi dans ces
expressions. Par contre, dans les Introductions le mot s’emploie aussi avec ‘on’
pour établir les effets de certaines drogues dans le syntagme verbal: ‘Drug X has a
(well-documented / dose-dependent / enabling…) effect on (disease Y)’. Cette
expression est aussi fréquente dans les Introductions et mais le mot ne témoigne
d’aucune prémodification nominale: les effets des drogues ne sont pas a priori
connus dans les Introductions et restent non-prouvés. Dans les Méthodes, le mot
s’emploie mois souvent et il se limite à l’usage sans déterminant qu’on voit dans
les titres ‘Effect(s) of (traitements/ guérisons X) in (maladie Y)’. Son emploi se
fige également autour de certains mots composés très fréquents qui ont des
rapports méthodologiques: dose-effect, median-effect. Dans les Résultats, le mot
sert de base d’oberservations avec des collocations assez restreintes ‘indicate/s, shows’ + a (similar) effect. Enfin, le mot sert dans les Discussions de
reformulateur général prémodifié par des termes spécifiques ‘This (bimodal,
differential…) effect’ + prédicat. Cette reformulation permet qu’on utilise le mot
comme support pour introduire le nouveau terme spécifique, et il est remarquable
que cette fonction ne se fait pas pour d’autres termes que nous pouvons qualifiés
d’ ‘anaphoriques’ (this result, this type, this model etc.).
En somme, le mot ‘effet’ nous a fourni beaucoup de données simplement parce
qu’il s’agit d’un mot unique qui est exploité avec une régularité étonnante dans
ces textes comme mot-charnière. Il sert de support nécessaire à la reformulation,
surtout pour pouvoir transformer de simples données en hypothèses. Ce procédé
est connu chez les linguistes systémiques (Halliday and Martin 1993) où ils
identifient en effet la nominalisation et la métaphore grammaticale comme
mécanismes primordiaux de la construction des textes scientifiques. La
progression des idées, le cumul et la déconstruction de nominaux que nous avons
observés en haut servent à illustrer que ces processus sont entièrement liés à la
phraséologie restreinte d’une poignée de mots. Nous proposons que ces termes
sont en effet de véritables institutions qui servent à réorienter le discours.
7 Conclusion.
Nous avons essayé de démontrer que même des mots grammaticaux de la langue
spéciale peuvent avoir des collocations très précises, et que ces collocations jouent
un rôle important dans la phraséologie de chaque section de l’article. Nous avons
suggéré aussi que les cooccurrences des mots lexicaux connaissent une
progression particulière dans le texte. Ce qu’il faut retenir dans cette analyse, c’est
que ces cooccurrences sont relevées de textes souvent très différents du point de
vue thématique et générique. A notre avis, ces cooccurrences témoignent de la
présence d’un discours, ou même d’un métadiscours, qui s’accorde avec les
activités des chercheurs et impose des régularités parfois étonnantes, voire même
Comment expliquer la régularité et la prévisibilté de certaines formules? Nous
imaginons plusieurs possibilités. Les caractéristiques linguistiques de ces textes
représentent très souvent des choix lexicaux restreints, délimités dans un éventail
phraséologique potentiellement beaucoup plus large dans la langue générale. La
langue spéciale, comme l’a suggéré Sager et al. (1980) tend en effet à figer le
discours. Mais si ce figement est connu depuis longtemps, personne n’a
soupçonné qu’il s’agirait d’un figement dans presque tous les domaines
grammaticaux. Nous avons pu identifier des figements liés à des catégories aussi
importantes que le temps, les sens sémantiques des verbes, la négation et la
modalité, voire même la distriubution grammaticale des expressions figées telles
in vitro (épithète devant le nom) et in vivo (complément circonstanciel) (Gledhill
Il nous semble que la redondance dans la langue générale joue un rôle dynamique:
elle permet une variation libre qui est exploité ‘au moment venu’ dans les textes à
caractère général. Il s’agirait d’une fonction discursive. Nous proposons que le
discours spécialisé se sert de cette redondance autrement. Nous proposons trois
fonctions possibles du figement phraséologique dans le discourse scientifique:
1 La fonction communautaire de la phraséologie. La communauté, qui est peut-
être autant composée d’Anglophones de langue seconde que de langue maternelle
préfère certaines structures fixes au dépens d’autres. Nous signalons que la plupart
des articles dans notre corpus ont plusieurs auteurs, souvent avec des provenances
non-anglophones. La recherche sur l’emploi et l’apprentissage des expressions
figées (Granger 1996) a démontré que les apprenants préfèrent exploiter des
expressions figées plutôt que des expressions ‘innovatrices’, et ce serait le cas de
notre corpus. En plus, la prévisibilté du discours mènerait à une voix discursive
qui se répand dans la lecture générale sans pour autant que ce discours soit
‘appris’. Si le figement représente la cohérence de la communauté discursive,
c’est qu’il permet la prévision et l’acceptation dans la communauté. C’est la
même fonction que l‘accent’ ou le ‘dialecte’ dans les communautés linguistiques
plus larges: le figement permet d’identifier les nouveaux-venus, et comme l’a
montré Myers (1990) permet aussi l’exclusion. Nous proposons donc que la
phraséologie est un aspect très largement inconscient et acquis du discours
2 La fonction textuelle de la phraséologie. La phraséologie joue un rôle
déterminant dans la définition du ‘genre’ textuel. Nystrand (1986) a souligné le
fait que la lecture et la production des textes ne sont pas ‘linéaires’. Dans notre
enquête nous avions trouvé que les scientifiques ne lisaient pas tout le texte,
choisissant des points d’entrée correspondant à des questions formulées lors d’une
première lecture de l’Abstract. Une fonction simple de la phraséologie prévisible
serait donc de réduire la possibilité d’expressions ambiguës et de signaler
clairement des références rhétoriques très communes (l’explication des buts,
l’élaboration des procédés cliniques répétitifs, l’évaluation des résultats etc.). En
analysant la reformulation dans toutes les sections des textes, ce qui nous a frappé
c’est que les textes scientifiques refondent les mêmes idées principales lors du
texte: la Discussion ressemble en effet à un résumé reformulatif, les Résultats
reprennent les mêmes expressions des Méthodes etc. Parfois on reformule en
élaborant les termes-clés, parfois en les englobant par des termes plus généraux,
souvent ayant un rapport avec la proposition revendiquée (the ‘claim’). Pourtant,
chaque section de l’article contient l’essentiel de l’argument: en reformulant, les
auteurs mettent leurs idées en scène au début et les déconstruisent dans le reste de
l’article. Comme nous l’avons signalé dans les section précédentes, cette fonction
est bien connue dans la littérature linguistique: ce que nous prônons, c’est le lien
entre la phraséologie et la fonction textelle.
3 La fonction génétique de la phraséologie. La théorie de l’évolution nous apprend
que le vrai critère de réussite du gène, c’est le fait d’être reproduit. Au risque de
nous voir ‘contaminer’ par le discours de notre propre corpus, nous proposons ici
que le phénomène phraséologique correspond aux mêmes règles que l’évolution
des fonctions génétiques. Dawkins, et bien d’autres ont remarqué le rôle des
‘mèmes’ dans l’évolution culturelle: la présence d’unités culturelles, souvent
apprises dans leur totalité, qui subsistent sans qu’on puisse les expliquer ou même
les éradiquer. Par exemple, Dennet (1996) reprend l’exemple des traditions, des
refrains musicaux et des proverbes. A bien des égards, les collocations
ressemblent à ces entités transmises dans l’évolution du discours.
La génétique nous apprend aussi que certains gènes fonctionnent dans un contexte
précis mais que dans d’autres contextes ils n’ont pas de fonction et sont
redondants. Ce n’est pas la forme du gène qui compte mais sa mise en application.
Evidemment, les collocations et la phraséologie dans le discours obéissent aux
mêmes règles. Il y a deux sortes de ‘réussite’ chez les gènes, et probablement chez
les collocations aussi: la transmission ‘heuristique’, qui transmet le gène non
parce qu’il fonctionne mieux que d’autres mais simplement parce qu’il ne
présente pas de problèmes pour les individus qui sont contraints de le transporter.
Autrement dit, il n’y a pas de raison particulière pour les changer. En même
temps, la transmission ‘mutative’ accorde aux gènes nouveaux ou mutés une
réussite s’ils arrivent à apporter un avantage au transmetteur. Dans le context du
discours scientifique, nous savons que ce sont les ‘formules toutes faites’ et non
pas des données en masse que les meilleurs chercheurs arrivent à faire passer à
leurs collègues. Mais de même pour les gènes ‘heuristiques’, ce n’est que dans
l’application que ces unités retrouvent leur existence. L’application peut, dans le
domaine du discours se réaliser simplement dans la ‘référence’ ou la ‘citation’ ou
même dans l’application d’une nouvelle perspective, tel l’exemple de la
‘synthèse’ reformulée en ‘stratégie’ que nous avons élaboré plus haut. Il ne serait
pas impossible de considérer ainsi les néologismes et les nouvelles combinaisons
de collocations. Si le figement s’impose, comme l’a démontré Pavel dans le
domaine terminologique, nous devrions évoquer le figement de l’idée dans la
communauté discursive. Dans son histoire sociale de la notion du virus, Kevles
(1996) a démontré que ce sont les évolutions de perspectives, liées à des
altérnances d’expressions qui ont fait progresser la science de la cancérologie. Le
virus, dit-il, ne pouvait en aucune publication s’exprimer en sujet de phrase parce
qu’on n’acceptait pas cette valence. Selon Kevles, les premiers virologistes ont dû
y suppanter le terme moins menaçant ‘milk factor’. Nous associons donc le flux
des collocations et de la phraséologie au conflit discursif qui mesure très souvent
la réussite scientifique non pas en termes rationnels ou cliniques mais en citations
Références bibliographiques. Borko H. and Bernier C.L. Abstracting concepts and methods New York Academic Press, 1975 Cremmins E.T. The Art of Abstracting Philadelphia ISI Press, 1982 Gläser, Rosemarie. "A multi-level model for a typology of LSP genres." in Fachsprache Vol. 15/1-2: 18-26, 1992 Gledhill, Christopher ‘Collocation and genre analysis. The discourse function of collocation in cancer research abstracts and articles." In Zeitschrift für Anglistik und Amerikanistik. Vol 1:1-26, 1995 Gledhill, Christopher. ‘Science as a collocation. Phraseology in cancer research articles.’ in Botley S., Glass J., McEnery T. and Wilson A. (eds) Proceedings of Teaching and Language Corpora Lancaster University UCREL Technical Papers Vol. 9 :108-126, 1996 Granger, Silviane. ‘Prefabricated patterns of advanced EFL writing: collocations and lexical phrases’. In A. Cowie (ed.) Phraseology. Oxford: Oxford University Press, 1996 Gross, Maurice Les expressions figées en français. Paris: Orphys, 1996 Halliday, Michael et Martin, Jim. Writing Science: Literacy and Discursive Power London: Falmer Press, 1993 Harvey Annamaria. ‘El fonómeno de la reformulación des discurso cientifico.’ Lenguas Modernas 22:105-112, 1995 Hyland Kenneth. “Hedging in Academic Writing and EAP textbooks.” In ESP Journal 13/3 :239-256, 1994 Johns, Tim et Scott Michael. Microconcord concordancing programme. Oxford University Press, Oxford, 1994 Kevles, Daniel. ‘Pursuing the Unpopular: A History of Courage, Viruses and Cancer in Silvers’, Robert (réd) Hidden Histories of Science London: Granta :69- 114, 1997 Knowles Frank. ‘Lexical cartography in LSP texts.’ In Somers (ed.) Terminology, LSP and Translation Studies in Honour of Juan C. Sager. Amsterdam, John Benjamins, 1996 Kokourek, Rotislav Rousseau, Louis-Jean et collectif ‘Terminologie, discours et textes spécialisés’ in Actes du XVe Congrès International des Linguistes, Québec, Presses Universitaires de l’Université Laval :187-212, 1992 Kretzenbacher H.L. Rekapitulation: Textstrategien der Zusammenfassung von wissenschaftlichen Fachtexten Tübingen: Gunter Narr Verlag, 1990 MacKenzie, J Lachlan ‘What is Functional Grammar?’ in Actes du XVe Congrès International des Linguistes, Québec, Presses Universitaires de l’Université Laval :95-106, 1992 Makkai, Adam ‘Idiomaticity as the Essence of Language’ in Actes du XVe Congrès International des Linguistes, Québec, Presses Universitaires de l’Université Laval :361-365, 1992 Mochet, Marie-Anne. ‘Expressions et groupements discursifs de l’oral: questions d’inventaire et propositions didactiques’, Colloque triangle , ENS Fontenay / St Cloud, 7-8 mars 1997. Myers, Greg. Writing Biology: Texts in the Social Construction of Scientific Knowledge Milwaukee: University of Wisconsin Press, 1990 Nwogu, Kevin .N. ‘Discourse variation in medical texts: Schema, theme and cohesion in professional and journalistic accounts.’ Thèsenon publiée, Language Studies Unit, Aston University, 1989. Nystrand M. What Writers Know. The Language, Process and Structure of Written Discourse New York: Academic Press, 1982 Pavel, Sylvie. ‘Neology and phraseology as terminology-in-the-making.’ in H.B. Sonneveld & K.L.Loening (eds.) Terminology. Applications in interdisciplinary communication. John Benjamins: Amsterdam: 21-34, 1993 Pawley, Andrew. et Syder, Francis H. ‘Two puzzles for linguistic theory: nativelike selection and nativelike fluency.’ In J.C. Richards et R.W. Schmidt (eds.) Language and Communication London, Longman: 191-227, 1983 Sager Juan C., Dungworth D. et P. F. McDonaldEnglish Special Languages: Principles and Practice in Science and Technology Wiesbaden, Oscar Nadstetter Verlag, 1980 Salager-Meyer Françoise. “Hedges and Textual Communicative Function in Medical English Written Discourse.” In ESP Journal 13/2:149-170, 1994 Sinclair John. McH. Corpus, Concordance, Collocation Oxford, Oxford University Press, 1991 Stubbs Michael. Text and Corpus Analysis. London, Routledge1996. Swales, John. Genre Analysis: English in Academic and Research Settings Cambridge: Cambridge University Press, 1990 Thomson G. and Yiyun Y. ‘Evaluation in the reporting verbs used in academic papers.’ in Applied Linguistics Vol. 12/4: 365-382, 1991 Williams I. A. ‘A contextual study of lexical verbs in two types of medical research article.’ in ESP Journal. Vol 15/3 :175-198, 1996 Yorio, Carlos A. ‘Conventionalized language forms and the development of communicative competence’. In TESOL Quarterly Vol. 14/4 :433-442, 1980
Appendice 1: Concordance de ‘patients’ dans les articles de recherche.
1 among patients and controls. Among patients who had progressive disease, 21/ e maximum tolerated dose (MTD) for patients who had a good performance status, 3 he 48-h samples were obtained from patients who had received leucovorin plus 4effect of ondansetron principally in patients who had low excretion of cortisol. 5 trations were highest in the three patients who succumbed to pulmonary toxicit Introductions 1 tissues frequently occur in cancer patients, and depletion of host adipose tiss 2 he mediators of cachexia in cancer patients. As a model of cancer cachexia, we 3 treatment of head and neck cancer patients. In order to obtain further insight 4 apeutic treatment of breast cancer patients in the future, it is essential to e 5 issue and muscle protein in cancer patients is an important parameter determini Méthodes 1 for entry into the present study, patients were required to have a histologica 2 asis of the TNM classification, the patients were classified into one of three 3 r to and after ifosfamide therapy, patients were hydrated i. v. with I I norma 4 toxic effects of all prior therapy. Patients were excluded from the study if th 5 any toxicity was documented. Three patients were treated at each dose level an 6 FU at 500 mg/m2 prior to surgery; 6 patients received a 2-h infusion with leuco 7 sion was started. Additionally, all patients received ondansetron (8 mg, p.o. x 8 ee of the Free University Hospital. Patients received an i. v. bolus injection 9 h days. In the statistical analyses patients responding with ‘no’ or ‘mild’ naus 10 atients were enrolled at that dose. Patients who exhibited stable disease or a Résultats 1 h age and menopausal status of the patients, tumour size, the number of positiv 2 rall response rate in all eligible patients was 26% (9/35; 95% confidence inte 3 on of survival for the 15 evaluable patients was 92 days (range, 30-568 days). A 4 t an approximately equal number of patients was present in each group. Similarl 5 he mean l-h concentration in these patients was significantly higher than that 6 e comparable with those measured in patients treated at 720 mg/m2. The tl/2 val 7 ea and vomiting occurred in 50% of patients treated at 6,500 mg/m2, and one of 8 d. It is noteworthy that four other patients treated at 6,500 mg/m2 and another 9 ated at 6,500 mg/m2, and one of six patients treated at this dose experienced g 10 mbocytopenia occurred in two of six patients treated at 6,500 mg/m2; in one pat
11 /time profiles were obtained in 15 patients receiving a dose of 80 mg/m2, mainl 12, chi2 (1)<0.54, P’s>0.26). Among patients receiving ondansetron and placebo, 13 ol excretion Separate analyses for patients receiving ondansetron and placebo a 14 points, several samples taken from patients receiving leucovorin and SFU were a 15. The mean cortisol excretion in patients receiving dexamethasone was 28.8pm
1 ide to parent drug. Interestingly, patients with high concentration ratios expe 2 need to be devised. Besides, many patients with other types of cancer are not 3 gnificant impact on the survival of patients with metastatic melanoma. Thus, ne 4 drug may play in the management of patients with epidermoid head and neck canc 5 ma 180 or from the ascites fluid of patients with hepatoma, appears to differ f
Appendice 2: Concordances d’ ‘effect’ dans les articles de recherche.
Titres 1 epatocytes of female B6C3F1 mice. 124 Effect of varying exposure regimens on meth 2 duced Lymphosarcoma Cells’ Antitumor Effect of Interferon plus Cyclosporine A fo 3 d into the hepatic artery. Effect of toremifene on antipyrine eliminat 4 Soliton Model Compounds combination effect of vaccination with il2 and il4 cdna 5 d are absent in chronic pancreatitis. Effect of exogenous heparin on anchoragein
Abstracts 1 secondary recipients. The antitumor effect of cells generated by IFN plus CsA t 2 le maintaining the cardioprotective effect of the liposome carrier as suggeste 3 nhibited the tumor growth-promoting effect of TP as shown by 81% and 80% tumor 4 lot analysis. The growth-inhibitory effect of doxorubicin, daunorubicin, N,N- 5 amil enhanced the growth inhibitory effect of vindesine on both H69/VDS (x 12.0
Introductions 1 were mediated primarily through an effect on the male (NTP, 1989; Fail et al., 2 s between two bilayer components, an effect on the hydrolysis kinetics of phosp 3 emetic agents have a well documented effect on mild to moderate chemotherapy in 4 her granisetron has a dose-dependent effect on gastrointestinal transit and to 5 1 uences have had a profound enabling effect on research in biology. Until a few
6 y few studies have investigated the effect of liposome encapsulation on the p 7 r words if hyperthermia changes the effect of Doxo on the microcirculation and 8 onditions [ 10- 12] . Therefore, the effect of a low dose of the drug might be pote 9 rat liver model to investigate the effect of toremifene on the elimination of 10 tissue might also be a part of the effect of NDP on the cardiac muscle. Anthr Méthodes 1 provides graphic representations of dose-effect curves and the median- effect p 2 mity of the experimental data to the median-effect principle of the mass-action 3 fold serially diluted to generate a dose-effect relationship in the cytotoxicit 4 rvival distribution. To estimate the effect of different factors on survival, a 5 stable for at least I month.Fig. 2. Effect of curcumin on PKC activity. PKC pa Résultats
1 arious cell types. Fig. 3 shows the effect of analogues JBI (D domain), JB2 (C 2 again, biotin reduced the antitumor effect, while cephalexin and sulfathiazole 3 16:0-PC showed the least stimulating effect, with a maximum of 109% after treat 4 roups. If the ANOVA indicated a time effect within one group, data obtained at i 5hibition (data not shown). A similar effect of the RIa anti-sense was observed i
1 to be dose-dependent. This bimodal effect on tumor-cell growth is compatible w c 2 (Fig. 3). How can this differential effect on tumorigenicity vs. experimental 3 itogenic activity of the serum. This effect was independent of oestrogens, insu 4 presense of cholesterol, then this effect was not reflected in change kinetics 5 degradation by HT29 TX66 cells. This effect on ECM degradation indicates that c
Bio-bibliographie.
Chris Gledhill est maître de conférences en français et linguistique à l’université de Saint
Andrews en Ecosse. Il a enseigné l’anglais de spécialité à l’université d’Aston et y a élaboré sa thèse doctorale en 1995 (Scientific Innovation and the Phraseology of Rhetoric). Son premier livre (Phraseology in Science Writing) est à paraître et il prépare actuellement un second livre sur la phraséologie dans les langues artificielles. Il prépare également un projet interdisciplinaire exploitant des corpus multilingue et diachronique.
Le corpus PSC est à la disposition des linguistes. Renseignements: Chris Gledhill School of Modern Languages University of St Andrews St Andrews FIFE KY16 9PH E-mail: [email protected]
Financial Times FT.Com ( PharmaWire) Pharmawire is part of The Mergermarket Group which is a division of the Financial Times Group, publisher of the Financial Times newspaper, FT.com, Expansion and FT Deutchsland. The FT Group is a division of Pearson plc, the international media group. Roche: Boniva patent prosecution history and repeated challenges on biphosphonate class expected to
For many gardeners a slight air of mystery can surround the use ofgrasses in gardens, but in fact they are deceptively easy to use and arereally no different from most perennial plants. Certainly there aregrasses which are ‘spreaders’, but those mostly offered by specialist nurseriesand good garden centres are clump forming plants that have excellent gardenmanners. Strongly architectura