نامه فرهنگستان

نامه فرهنگستان

انواع واحدهای چندواژه‌ای در زبان فارسی

نوع مقاله : مقاله پژوهشی

نویسنده
پژوهشگر فرهنگستان زبان و ادب فارسی، تهران، ایران
چکیده
واحدهای تک‌واژه‌ای (واژه‌ها) واحدهایی زبانی هستند که نقش نظم‌دهی و مقوله‌بندیِ تجاربِ بشری را در قالب واحدهای نمادین و نام‌گذاری بر مفاهیم تازه بر عهده دارند. در زبان‌های طبیعی، افزون بر واحدهای تک‌واژه‌ای، سازه‌های زبانی‌ای وجود دارند که اگرچه به‌لحاظ ساخت‌واژی با واحدهای تک‌واژه‌ای مطابقت ندارند، دقیقاً همان نقش را ایفا می‌کنند. این سازه‌ها عبارت‌های چندواژه‌ای هستند، واحدهایی واژگانی که از توالی دو یا بیشتر از دو واژه ساخته می‌شوند و به لحاظ واژگانی، نحوی، معنایی، کاربردشناختی و آماری، نسبت به مؤلّفه‌های پایه، در عناصر سازندۀ خود بانشان هستند. این واحدها بخش قابل‌توجّهی از واژگان زبان را به خود اختصاص می‌دهند و، با توجّه به ترکیب آزاد واژه‌ها در آنها، ویژگی‌های صوری و نقشی منحصربه‌فردی پیدا می‌کنند و شامل انواع متنوّعی می‌شوند. میزان کاربرد این واحدها و اهمّیّت آن‏ها در زبان به هیچ وجه کمتر از واحدهای تک‌واژه‌ای نیست، به همین دلیل شناخت و توصیف آنها، نه‌تنها در حوزۀ زبان‌شناسی، که در حوزه‌های بسیار دیگری، از جمله گروه‌شناسی، واژه‌شناسی، واژگان‌نگاری، زبان‌شناسی رایانه‌ای، زبان‌روان‌شناسی، زبان‌جامعه‌شناسی و پردازش زبان طبیعی، توجّه پژوهشگران را به خود جلب کرده است. در این مقاله، پس از مقدّمه، به اهمّیّت واحدهای چندواژه‌ای، لزوم شناخت و توصیف آن‏ها پرداخته شده، سپس تعاریفی از واحدهای چندواژه‌ای و معیارهایی برای استخراج آن‏ها به دست داده شده و سرانجام، برپایۀ اصول و قواعد مطرح‌شده، انواع واحدهای چندواژه‌ای معرّفی و طبقه‌بندی شده است. این معرّفی و طبقه‌بندی براساس داده‌ها، در چهارچوب زبان امروز و بر اساس مشاهدات هم‌زمانی، صورت گرفته است.
کلیدواژه‌ها
موضوعات

عنوان مقاله English

Types of Multi-Word Units in Persian

نویسنده English

Saeed Rafiei Khezri
Researcher at the Academy of Persian Language and Literature, Tehran, Iran
چکیده English

Mono-word units (lexemes) are lexical units that have essential function of organizing and categorizing human experience into symbolic units and to name new concepts. In natural languages, more than mono-word units, there are linguistic constructions, although, according to word formation, do not conform to mono- word units serve precisely the same function. These constructions are multi-word expressions (MWEs), the lexical units that formed by two or more lexemes and according to the properties of the component lexemes are lexically, syntactically, semantically, pragmatically and statistically marked. These units make up a significant portion of language lexicon and display some formal and functional idiosyncratic properties with respect to free word combinations and include an extremely varied set of types. The use of these units and their importance in language is by no means inferior to mono- word units, for this reason, recognizing and describing them has attracted the attention of researchers not only in the field of linguistics, but also in many other fields such as phraseology, lexicology, lexicography, computer linguistics, psycholinguistics, sociolinguistics and natural language processing. In this article, after the introduction, first the importance of MWUs, the need to recognize and describe them are discussed; then the definitions of MWUs and criteria for extracting them are provided; finally based on the principles and rules, the types of MWUs are introduced and their classification is presented. This presentation and classification is based on data in the context of today language and synchronic observations.

کلیدواژه‌ها English

&ldquo
mono-word uits&rdquo
multi-word units&rdquo
to be multi-word&rdquo
lexical unit&rdquo
, &ldquo
types of MWEs&rdquo
انوری، حسن (1381)، فرهنگ بزرگ سخن، 8 ج، تهران: سخن.
باطنی، محمّدرضا و دستیاران (1388)، فرهنگ همایندها پویا (انگلیسی- فارسی)، تهران: فرهنگ معاصر.
ـــــــــ با دستیاری زهرا احمدی‌نیا (1392)، فرهنگ معاصر پویا (اصطلاحات و عبارات رایج: فارسی-انگلیسی)، تهران: فرهنگ معاصر.
ذوالفقاری، حسن (1388)، فرهنگ بزرگ ضرب‌المثل‌های فارسی، 2 ج، تهران: معین.
رفیعی خضری، سعید (1391)، «ماهیّت گروه‌واژه‌ها: مطالعه‌ای در ساختار گروه‌واژه‌های فارسی»، مجموعۀ مقالات هشتمین همایش زبان‌شناسی ایران، به کوشش محمّد دبیرمقدّم، ج 1، تهران: دانشگاه علّامۀ طباطبایی، صص 326-315.
ـــــــــ (1392)، «آموزش گروه‌واژه‌ها در یادگیری زبان دوم: بحثی نظری»، مجموعۀ مقالات دومین همایش ملّی آموزش زبان فارسی و زبان‌شناسی، شیراز، 25 و 26 اردیبهشت، ص 123-134.
ـــــــــ (1394)، «رده‌شناسی واحدهای چندواژه‌ای در زبان فارسی»، مجموعۀ مقالات برتر سومین همایش ملّی زبان‌شناسی و آموزش زبان فارسی، به کوشش سید محمّد حسینی و شهلا شریفی، تهران: نویسۀ پارسی، ص 95-115.
ـــــــــ (1397)، فرهنگ اصطلاحات زبانی (در ادبیّات داستانی و نمایشی)، ج 1 (1250-1300 ش)، تهران: فرهنگستان زبان و ادب فارسی.
صدری‌افشار، غلامحسین (1388)، فرهنگ زبانزدهای فارسی، تهران: مازیار.
فرهنگستان زبان و ادب فارسی (1391)، فرهنگ واژه‌های مصوّب، دفتر نهم، تهران: نشرآثار فرهنگستان زبان و ادب فارسی.
معین، محمّد (1371)، فرهنگ فارسی، 6 ج، تهران: امیرکبیر.
میرعابدینی، حسن (1389)، مروری بر تاریخ‌نگاری ادبیّات معاصر (دفتر دوم). مجموعۀ ادب معاصر فارسی 7، تهران: فرهنگستان زبان و ادب فارسی.
نجفی، ابوالحسن (1378)، فرهنگ فارسی عامیانه، 2 ج، تهران: نیلوفر.
 
Baldwin, Thimothy (2004) ‘Multiword expression,’ CSSE. University of Melbourne, www.CSSE.unimelb.edu.au/tim/pubs/altss.
ـــــــــ  and Su Nam.Kim (2010) ‘Multiword expressions,’ In Nitin Indurkhya and Fred J.Damerau (eds), Handbook of Natural language Processing, Second Edition, USA: CRC Press, p 267-292.
Bauer, Laurie (2019), Complex Lexical Units (compounds and multi-word expressions), chapter 14, Volume 9 in the series kowergens Divergens, De Gruyter.
Chakraborty, Christine (2010), Multiword Expressions, India: Jadavpu University Press.
Fellbaum, Christine (2007), Idioms and Collocations, London: Continum.
Fillmore, C (2003), ‘An extremist approach to multi-word expressions,’ In talk given at RCS, University of Pennsylvania.
Fillmore, C, P. Kay and M. C. O’Connor (1988), ‘Regularity and idiomaticity in grammatical construction,’ Language 64, p 501-538.
Firth, John Rupert (1957)A synopsis of linguistic theory 1933-1955,’ In Studies in Linguistic Analysis, edited by J. R. Firth 1-32, Oxford: Blackwell, p 1-32.
Grant, L. and L. Bauer (2004)Criteria for re-defining idioms: Are we barking up the wrong tree?,’ Applied Linguistics, 25, p 38-61.
Green, Speire, Marie-Catherine de Marneffe and Christopher D. Manning. (2012), ‘Parsing models for identifying multiword expressions,’ Computational Linguistics, vol 39, no 1, p 1-33.
Hendrickx, Iris, Arália Mendes and Sandra Antunes (2010), ‘Proposal for multi-word expression annotation in running text,’ Proceeding of The Forth Linguistic Annotation Workshop, ACL 2010, p 152-156.
Katamba, Francis and John Stanham. (2006), Morphology, Second Edition, New York: Palgrave Macmillan.
Kim, Su Nam (2005), Statistical Modeling of Multiword Expressions, Ph.D Completion Seminar, CSSE. University of Melbourne, Canada.
Manning, Chris and Hirrich Shütze (1999), Foundations of Statistical Natural Language Processing, Cambridge: MIT Press.
Masini, Francesca (1995), ‘Multi-Word Expressions and Morphology,’ published online, 2019, http://cloi.org/10.1093/aerefore/9780199384655.013.611
Melčuk, Igor (1995), ‘Phraseme in language and phraseology in linguistics’ In M. Everaert and the others (eds), Idioms: Structural and Psychological Perspectives, Hillsdale, NJ: Lawrence Erlbaum Associates, p 167-233.
Moon, Rosamond (1998), Fixed Expressions and Idioms in English, Oxford. New York: Clarendon Press.
Sag, Ivan. A., Timothy Baldwin, Ann Copestak and Dan Flickinger (2002), ‘Multiword expressions: A pain in the neck for NLP,’ In Proceedings of the 3rd International Conference on Intelligent Text Processing and Computational Linguistics (CIC Ling-2002), Mexico City, Mexic, p 1-15.
Villavicencio, Aline and Valia Kordoni (2012), Multiword Expressions in Theory and Practice, Brazil: Federal University of Rio Grande.
Reference
Anvari, Hasan (2002), Farhang-e Bozorg-e Sokhan (the Great Dictionary of Sokhan), Tehran: Sokhan.
Bateni, Mohammad Rezā et al. (2009), Farhang-e Hamāyandhāy-e Pooya (englisi-fārsi) (Pooya Collocation Dictionary (English-Persian)), Tehran: Farhang-e Moʼāser.
ـــــــــ  Assistant: Zahrā Ahmadiān (2013), Farhang-e Moʼāser Pooya (englisi-fārsi) (Pooya Moʼāser Dictionary (English-persian), Tehran: Farhang-e Moʼāser.
Mirābedini, Hasan (2010), Moruri bar Tārkhnegāri-e Adabiyat-e Moʼāser (Daftar-e Dovvom) (A Review of Historygraphy of Contemporary Literature (second Book)), Majmuʼe-ye Adab-e Moʼāser-e Fārsi 7, Tehran: Farhangestān-e Zabān va Adab-e Fārsi.
Moʼin, Mohammad (1992), Farhang-e Fārsi (A Dictionary of Persian Words), Vol 6, Tehrān: Amir kabir.
Najafi, Abolhasan (1999), Farhang-e Fārsi-ye Amiyāne (A Dictionary of Persian Colloquialism), Tehrān: Niloufar.
Rafiei khezri, Saeed (2012), “Māhiat-e Goroohvazhehā: Motāleʼi dar Sākhtar-e Goroohvāzhehā-ye Fārsi (Study of Idioms: A Study about the Structure of Idioms in Persian,” Majmuʼe Maghālāt-e Hashtomin Hamāysh-e Zabānshenāsi, Ed. Mohammad Dabirmoghadam, Vol 1, Tehran: Daneshgāh-e Alāme-ye Tabātabāʼi, p 315-326.
ـــــــــ  (2013), “Āmoozesh-e Goroohvazhehā dar Yadgiri-ye Zabān-e Dovvom (Teaching Idioms in Learning Second Language),” Majmuʼe Maghālāt-e Dovvomin Hamāyesh-e Melli-e Āmoozesh-e Zabān-e Fārsi va Zabānshenāsi, Shirāz, 25 & 26 Ordibehesht, p 123-134.
ـــــــــ  (2015), “Radeshenāsi-ye Vahedhā-ye Chanvazheʼi dar Zabān-e Fārsi (Typology of Multiword Units in Persian),” Majmuʼe Maghālāt-e Bartar-e Sevvomin Hamāyesh-e Melli-e Āmoozesh-e Zabān-e Fārsi, Ed. Seyed Mohammad Hosaini va Shahlā Sharifi, Tehrān: Nevise-ye Pārsi. p 95-115.
ـــــــــ  (2018), Farhang-e Estelāhāt-e Zabāni, dar Adabiyāt-e Dāstāni va Namāyshi (A Dictionary of Idioms in Fictional and Dramatic Literature), Vol 1 (1871-1921), Tehrān: Farhangestān-e Zabān va Adab-e Fārsi.
Sadri Afshar, Gholāmhossain (2009), Farhang-e Zabānzadha-ye Fārsi (A Dictionary of Persian Catchpherases), Tehran: Māziār.
Zolfaghāri, Hasan (2009), Farhang-e Bozorg-e Zarbolmasalhā-ye Fārsi (The Great Dictionary of Persian Proverbs), 2 Vols. Tehran: Moʼin.
دوره 24، شماره 6 - شماره پیاپی 100
نامه فرهنگستان (تحقیقات ادبی)
بهمن و اسفند 1404
صفحه 29-47

  • تاریخ دریافت 11 آبان 1400
  • تاریخ بازنگری 05 آذر 1400
  • تاریخ پذیرش 01 دی 1400