LanguageTool

البرمجيات قطة:
LanguageTool
تفاصيل البرنامج:
الإصدار: 2.9 محدث
تاريخ إيداع: 14 Apr 15
المطور: Daniel Naber
ترخيص: حرر
شعبية: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool هو برنامج تصحيح التجارب المطبعية مفتوحة المصدر مصممة للعثور على الأخطاء التي أدوات المدقق الإملائي العادية لا يمكن الكشف عنها. وهو أسلوب المدقق النحوي والتي من شأنها أن تجد أخطاء التي يتم تعريف قاعدة في ملفات التكوين XML، مثل الخلط و[لدقوو] المستندة القاعدة؛ على & ردقوو]؛ مع & [لدقوو]؛ هناك & ردقوو]؛


بالكشف عن مختلف المشاكل النحوي

ويمكن للبرنامج أيضا الكشف عن مختلف المشاكل النحوية ويأتي مع دعم لأكثر من 20 لغة، منها الانكليزية والألمانية والبولندية والفرنسية والإسبانية والسويدية واليونانية والصينية، الدانماركية، اليابانية، الآيسلندية، البرتغالية والبرتغالية البرازيلية.
بالإضافة إلى ذلك، يتباهى سهلة الاستخدام وبسيطة ومباشرة واجهة المستخدم الرسومية التي تسمح لأي شخص للصق النص الذي يحتاج إلى التدقيق الإملائي. يمكن أن تحقق النص في الحافظة، والنص العلامة، قص / نسخ / لصق النص، ويقيم في منطقة صينية النظام.


بالكشف عن مجموعة واسعة من المشاكل

من الحوار خيارات، يمكنك تمكين أي نوع من المشاكل التطبيق يمكن الكشف، بما في ذلك نمط سيئة، وأخطاء النحو واللغة العامية، وأخطاء الترقيم، الأخطاء المطبعية الممكنة، عبارات زائدة عن الحاجة، عادة بعبارة الخلط، رصف، والقيمة، دلالات، فضلا كما العبارات غير القياسية.


LanguageTool لليبر أوفيس وأوبن أوفيس

وبالإضافة إلى كونها تطبيق قائم بذاته، LanguageTool هو متاح أيضا امتدادا لاثنين من الأجنحة الأكثر شعبية وقوية مكتب مفتوح المصدر، ليبر أوفيس و Apache OpenOffice.org، مما يسمح للمستخدمين صحح نصوصهم بالنقر بزر الماوس الأيمن على عبارات مختارة أو الفقرات.


LanguageTool لموزيلا فايرفوكس

وبالإضافة إلى ذلك، فإن التطبيق هو أيضا متوفرة للتحميل كإضافة على للعالم و؛ [س] الأكثر شعبية متصفح ويب مفتوح المصدر في العالم، وموزيلا فايرفوكس. لا يتطلب أي إعادة تشغيل ويضع زر صغير على شريط الأدوات الرئيسي، مما يسمح لك لتدقيق النص المميز من المواقع أو النماذج.


تحت غطاء محرك السيارة وتوفر

يتم كتابة التطبيق بالكامل في لغة البرمجة جافا، مما يعني أنه و[رسقوو]؛ سا البرمجيات عبر منصة، مصمم للعمل مع أي توزيعة جنو / لينكس، فضلا عن BSD، وسولاريس، مايكروسوفت ويندوز وماك OS X التشغيل نظم، حيث تم تثبيت بيئة جافا.

ما هو الجديد في هذا الإصدار:



الكاتالونية:
تحديث POS العلامة القاموس
قواعد جديدة تضاف
الانذارات الكاذبة ثابتة
الإنجليزية:
وأضاف عدد قليل من القواعد الثابتة وعدد قليل من الانذارات الكاذبة
وأضاف العديد من القواعد نمط جديد ساهم هايكي Lehvaslaiho. كما أنها قد تسبب إنذارات كاذبة، لا يتم تفعيلها بشكل افتراضي. يمكنك تفعيلها عن طريق تشغيل جميع القواعد في الفئة الجديدة "سهل الانجليزية.
الاسبرانتو:
وأضاف عدد قليل من القواعد الجديدة
فرنسي
تحديث القاموس العلامة POS والقاموس Hunspell إلى Dicollecte 5.3
الألمانية:
وأضاف عدد قليل من القواعد الجديدة وإنذارات كاذبة الثابتة
وأضاف قاعدة جديدة أن يتحقق اتفاق الموضوع الفعل. في الوقت الراهن، يتم اعتماد حالات فقط مع "IST '،' السند '،' الحرب '، و' WAREN. مثال للأخطاء التي يتم الكشف عنها: 'دير هوند السند schA والفقرة؛ ن'، 'يموت السيارات الخاصة العراقية شنيل ". لجعل هذا العمل كقاعدة عامة، يتم توحيد عبارات الآن في disambiguation.xml: على سبيل المثال، "مان" في عبارة "عين مان" سيتم الاحتفاظ فقط القراءة اسمية (SUB: NOM: SIN: MAS)، في حين أنه كانت لدينا أيضا قراءات النصب وصيغة المجرور (SUB: AKK: SIN: MAS، SUB: DAT: SIN: MAS). (https://github.com/languagetool-org/languagetool/issues/233)
الإيطالية:
تحسين بعض القواعد
البولندية:
وأضاف العديد من القواعد الجديدة
البرتغالية:
وأضاف / محسنة العديد من القواعد
3695 كلمات مركبة (ما قبل الإصلاح) - أكبر قاعدة بيانات مجانية
الروسية:
قواعد المضافة وتحسين
الأوكرانية:
القاموس تحديث كبير
القواعد النحوية جديدة
جديدة بسيطة تحل محل الحكم للحصول على اقتراحات لينة
تحسينات disambiguator
علامات المجمع والتحسينات الإملائية
بالاحرف الاولى التحسينات علامات
الجملة و كلمة تحسينات tokenizing
تحسن التعامل مع رمز stres واصلة لينة
قواعد Bitext:
واضاف قاعدة بسيطة لفحص ما إذا كانت الترجمة تنتهي مع نفس علامة ترقيم مثل الأصلي (وهذا يشمل فقط.؟! حرفا).
أصبح من الممكن الآن لإضافة الملفات حكم bitext الخارجية على سطر الأوامر، باستخدام
الخيار -bitextrule. مسار الملف يجب أن يكون مطلقا. ملاحظة: هذا يسمح باستخدام قواعد bitext أيضا للغات التي لا تمتلك أية قواعد bitext تضمينها بشكل افتراضي.
الإملاء:
ملفات جديدة في /hunspell/spelling.txt يمكن استخدامها لإضافة كلمات المقبولة إلى المدقق الإملائي التي تعتبر أيضا عند إنشاء اقتراحات للكلمات. هذا هو مماثل لملفات /hunspell/ignore.txt، التي قبلت قائمة الكلمات التي * * لا تستخدم عند إنشاء اقتراحات للكلمات.
API:
قد أزيلت JLanguageTool.activateDefaultPatternRules () وJLanguageTool.activateDefaultFalseFriendRules () - جميع القواعد نمط وقواعد صديق زائف (إذا تم تحديد لغة ثانية) يتم تنشيط الآن تلقائيا عندما يتم استدعاء منشئ JLanguageTool. إذا كنتم تحتاجون إلى المدقق دون قواعد النمط القائم على XML، وتوسيع الطبقة اللغة (على سبيل المثال 'الإنجليزية') مع واحد أن يقوم بالكتابة فوق getPatternRules () طريقة وإرجاع قائمة فارغة هناك.
تم استبدال ManualTagger.lookup () من خلال ManualTagger.tag () بعد أن انتقدت منذ الإصدار الأخير
وقد تم نقل جميع الطرق والحقول من الفئة 'اللغة' ثابتة إلى فئة جديدة "لغات". أما الآن، فإن أساليب / الحقول في فئة اللغة لا تزال موجودة ولكن تم إهمال.
تمت إزالة LanguageIdentifierTools. استخدام LanguageIdentifier بدلا من ذلك.
إزالة (افتراضي) ResourceDataBroker.setResourceDir () وsetRulesDir () وهذه يمكن أن تكون مع مجموعة منشئ
تنظيف حتى الدرجة مساهم، على سبيل المثال إزالة getRemark ()
Category.setDefaultOff () قد أزيلت، وهذا يمكن تعيين عبر منشئ الآن
دروس سميت: o.lt.rules.patterns.Element = & GT؛ o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & GT؛ o.lt.rules.patterns.PatternTokenMatcher
تنظيفات API الصغيرة الأخرى التي يجب أن لا تؤثر على حالات الاستخدام الشائعة، على سبيل المثال IncorrectExample.getCorrections () عودة والقائمة unmodifiable الآن، وإزالة الأساليب إهمال.
خادم جزءا لا يتجزأ من:
تم إصلاح XML الهروب، وهذا قد يتسبب في وثائق XML غير صالحة إلى أن تعاد
الخيار ملف التكوين الجديد "maxWorkQueueSize" التي تمكنك من تعيين الحد الأقصى لحجم قائمة انتظار الطلب - إذا كان يحصل على أكبر من ذلك، سيتم رفض الطلبات (503 الخدمة غير متوفرة)
خادم يستجيب الآن مع رموز الحالة HTTP أكثر تحديدا لهذه الشروط الخطأ: 413 طلب الوحدة كبير جدا - إذا نص يتجاوز الحد الأقصى لحجم النص 503 الخدمة غير متوفرة - إذا الاختيار يتجاوز الحد الأقصى للوقت الاختيار
واجهة المستخدم الرسومية:
يمكن للGUI مستقل تتخذ الآن ملف نص عادي كحجة، وبعد ذلك يتم تحميل هذا الملف عند بدء التشغيل (جيثب القضية رقم 232).
سطر الأوامر:
أصبح من الممكن الآن لإضافة ملف قاعدة الخارجي عند استدعاء LanguageTool من سطر الأوامر. استخدام --rulefile لإضافة ملف. إذا كان اسم الملف يحتوي على التنسيق الذي يحتوي على اسم اللغة، سيتم استخدامها جنبا إلى جنب مع غيرها من القواعد. خلاف ذلك، وسوف تحل محل القواعد. يمكنك أيضا تحميل ملف خارجي مع الأصدقاء كاذبة باستخدام --falsefriends الخيار. يجب أن يكون اسم ملف مسار ملف المطلق، ويتم إضافة ملفات صديق كاذبة دائما لتلك التي تم تحميلها للغة. (جيثب القضية رقم 192)
حكم بناء الجملة:
قد يكون هناك قاعدة حاليا حكما بالسجن سبيل المثال واحدة طالما أن لديها 'تصحيح' السمة - وهذا يمكن أن ينقذ بعض التكرار إذا كانت الجملة الصحيحة الوحيدة هي نفس الجملة غير صحيحة مع تصحيح تطبيق. من قبل، كقاعدة عامة تحتاج اثنين على الأقل مثال الجمل.
"المثال" العنصر: نوع = "غير صحيحة" هو الآن اختياري إذا كان هناك 'تصحيح' السمة. و'تصحيح' سمة يعني أن الجملة غير صحيحة.
"المثال" العنصر: نوع = "الصحيح" هو الآن اختياري. لا 'نوع' سمة وليس 'تصحيح' سمة يعني أن الجملة صحيحة.
الداخلية:
لقد تحولت من طراز أباتشي تيكا للغة كاشف (https://github.com/optimaize/language-detector) لتحديد لغة النص تلقائيا. ينبغي أن يكون أسرع ويجب أن تكون النتائج أكثر موثوقية. كان الكشف عن الجاليكية أستورية ويتم تعطيل بسبب نوعية الكشف كانت منخفضة جدا وتتأثر أيضا الكشف عن الإسبانية.
ثابت الانحدار التي جعلت من المستحيل لتحميل الملفات حكم الخارجية في واجهة المستخدم الرسومية.

ما هو الجديد في الإصدار 2.8:



الأسترية:
الاعتماد على إزالة Hunspell، يستخدم الآن Morfologik عن التدقيق الإملائي
البريتونية:
وأضاف وتحسين بعض القواعد
الكاتالونية:
القاموس تحديث
قواعد المضافة وتحسين
الانذارات الكاذبة ثابتة
الهولندية:
العديد من القواعد المضافة وتحسين
الإنجليزية:
بعض القواعد الجديدة (بفضل نيك هوغ)
تحديث بلغة والمزج القواميس، وتحديد العدد رقم 202
مرشح جديد لاستخدامها لمطابقة partofspeech أجزاء من الكلمات، على سبيل المثال: في * هذا وسوف تبقي مباراة للكلمات التي تبدأ مع 'في' وحيث لا يوجد سوى الجزء بعد 'في' هو صفة (علامة POS "JJ" ). و'لا: 1' هو موقف رمزي، أي هنا يشار الأول (والوحيد) مطابقة ل.
الفرنسية:
وأضاف وتحسين بعض القواعد
الألمانية:
وأضاف وتحسين بعض القواعد
البولندية:
وأضاف وتحسين العديد من القواعد
أصدقاء كاذبة المضافة وتحسين للغة الإنجليزية
البرتغالية:
وأضاف / محسنة العديد من القواعد
الأسبانية:
الاعتماد على إزالة Hunspell، يستخدم الآن Morfologik عن التدقيق الإملائي
ملف قواعد إخراجها
إضافة المزيد من القواعد
التغالوغ:
الاعتماد على إزالة Hunspell، يستخدم الآن Morfologik عن التدقيق الإملائي
حرف شرطة ("") هو محدد الآن عندما tokenizing النص
الروسية:
قواعد المضافة وتحسين
وأضاف عدد قليل من القواعد صديق زائف (الروسية / إنجليزي)
الأوكرانية:
العديد من القواعد الجديدة (بما في ذلك الاتفاق مع الأسماء والتعبيرات الوقت الخ)
حكم تحسين التغطية
القاموس التحديث (تحسينات كبيرة لأسماء الأعلام وحالة ندائي)
علامة جديدة وقاعدة ليحذر حول هجاء البديل
معلومات تردد كلمة تمت إضافتها لتحسين اقتراحات التدقيق الإملائي
بعض القواعد disambiguator جديدة
حكم بناء الجملة:
... ويمكن الآن أن تضاف إلى rulegroup أن تؤثر على كل قواعد هذه المجموعة
إذا كنت في وضع القواعد الخاصة بك التي لا تشكل جزءا من LT يمكنك الآن إضافة الخارجية = "نعم" لفئات الخاصة لمنع ارتباط القاعدة على community.languagetool.org من الظهور في منطقتنا مستقل واجهة المستخدم الرسومية (إن صلة لا تعمل من أجل القواعد التي ليست جزءا من التوزيع الرئيسي لLT). (جيثب قضية # 223)
إذا تحدد مجموعة القاعدة الافتراضية = "قبالة"، والقواعد داخل المجموعة القاعدة قد لا أيضا تحديد الافتراضي = "على" / "قبالة".
API:
الفئات وأساليب إزالة هذا قد انتقدت منذ 2.7 أو أكثر
خادم جزءا لا يتجزأ من:
الخيارات ملف التكوين 'requestLimit "و" requestLimitPeriodInSeconds' ويمكن الآن أن تستخدم أيضا لخادم HTTP (وليس فقط لخادم HTTPS)
جديد ملف التكوين خيار "trustXForwardForHeader ': تعيين هذا إلى' true 'إذا قمت بتشغيل خادم خلف وكيل العكسي وتريد الحد طلب للعمل على عناوين IP الأصلية التي يقدمها رأس HTTP" Xforwardedfor "، تعيين عادة عن طريق الوكيل. إذا قمت بتشغيل خلف وكيل ولكن لا تعيين هذه الخاصية إلى true، يمكن للمستخدم واحد استخدام جميع الطلبات بحيث يمكن للمستخدمين الآخرين سوف أيضا الحصول على رسالة خطأ بسبب الحد الطلب.
إصلاح رد بعد وضع الموعد النهائي: ... كان فارغا في بعض الأحيان، الخلط بين الاختيار نص في وورد
لم تكن تعطيل قواعد Bitext بشكل صحيح، حتى لو كانوا المحدد مع معلمة المناسبة لخادم؛ الآن تم حلها
المشكلة الثابتة مع مواقف غير لائقة لبعض القواعد bitext (العدد رقم 218)
واجهة المستخدم الرسومية:
تمت إضافة الإعداد "errorColors" جديد لملف التكوين languagetool.cfg. ويمكن استخدامه لتعيين لون الخلفية من الأخطاء. على سبيل المثال، errorColors = مطبعية: # b8b8ff، على غرار: سوف # ffb8b8 تظهر الأخطاء "المطبعية 'مع خلفية زرقاء وأخطاء' أسلوب 'مع خلفية حمراء في الجزء العلوي من النافذة LT. "مطبعية" و "أسلوب" هي الأنواع التي تم تعيينها في grammar.xml بأنه "نوع = ...". ليس هناك واجهة المستخدم بعد تكوين هذه الألوان. لاحظ أنه يجب فقط تحرير ملف languagetool.cfg عند عدم تشغيل LT.
الداخلية:
لم يتم تفعيل قواعد داخل مجموعة الحكم إذا كان الحكم السابقة من نفس rulegroup استخدمت الافتراضي = "إيقاف": تصحيح خطأ
لا يتم تجاهل الكلمات بعد الآن من قبل المدقق الإملائي لمجرد وقوعها في الاقتراح على القاعدة. إذا كنت تريد أن المدقق الإملائي لتجاهل الكلمات على الصعيد العالمي، وإضافتها إلى hunspell / ignore.txt. لتجاهلها تبعا للسياق، إضافة 'ignore_spelling' القاعدة إلى disambiguation.xml.
ويمكن الآن ملف "hunspell / prohibit.txt 'أن تستخدم للاحتفال الكلمات كما الأخطاء الإملائية حتى لو المدقق الإملائي تقبل عادة لهم. وهذا مفيد لتحسين المدقق الإملائي LanguageTool دون انتظار المدقق المنبع إلى تحديث. الملف 'prohibit.txt' هو عكس "ignore.txt"، والذي يسبب المدقق الإملائي لتجاهل الكلمات.
يمكن الآن بلغة partofspeech لمعظم لغات تمديدها عن طريق إضافة إدخالات إلى ملف ORG / languagetool / موارد / XX / added.txt (XX كونه رمز اللغة). والشكل هو "fullform baseform postag"، ثلاثة أعمدة مفصولة علامات التبويب. وهذا يجعل من السهل على المستخدمين (والمطورين) لتمديد بلغة POS، كما أنها لا تحتاج إلى تصدير وتعديل وإعادة القاموس الثنائي لكل تغيير.

ما هو الجديد في الإصدار 2.7:



البريتونية:
قواعد المضافة وتحسين
قاعدة جديدة أن يتحقق إذا كان يوم من أيام الأسبوع يطابق التاريخ، على سبيل المثال يكشف "Gwener 28 لEost بمعنى 2014"، كما أن التاريخ ليس الجمعة.
الكاتالونية:
قواعد المضافة وتحسين
الانذارات الكاذبة ثابتة
الهولندية:
العديد من القواعد المضافة وتحسين
تحولت إلى المدقق الإملائي استنادا Morfologik-
-English:
هل تريد أن تكون جزءا من الفريق الذي يتطور أقوى أداة التدقيق المصدر المفتوح في العالم؟ نحن نبحث عن معيل لقواعد اللغة الإنجليزية في LanguageTool. رؤية http://wiki.languagetool.org/tasks-for-language-maintainers لمزيد من التفاصيل.
وقد تم تمديد جميع قواميس اللغة الإنجليزية لاحتواء الطبقات تردد كلمة لتحسين اقتراحات المدقق الإملائي (يتم أخذ البيانات تردد من https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js/imes/ قواميس / اللاتينية، واللغات الأخرى التي تستخدم بالفعل هذه الميزة).
اقتراحات أفضل للمتعلمين الانجليزية: الأفعال غير القياسية وصيغ، والصفات الآن وعادة ما يكون أفضل اقتراح. على سبيل المثال، "thinked 'يقترح' يعتقد '،' إمرأة 'يقترح' النساء '.
وتوفر المزيد من الأخطاء الإملائية الاقتراحات الآن، على سبيل المثال 'garentee' (ضمان)، "بالامتنان" (تشكرون). قد يؤدي ذلك إلى حدوث انخفاض أداء ~ 10٪ (أكثر للنصوص مع الكثير من الكلمات غير معروفة).
قاعدة جديدة أن يتحقق إذا كان يوم من أيام الأسبوع يطابق التاريخ، على سبيل المثال يكشف "الاثنين 7 أكتوبر، 2014"، كما أن التاريخ ليس الاثنين. وهذه القاعدة تعمل إلا بالكشف عن تنسيق التاريخ في الاستخدام. حتى الآن، يتم اعتماد هذه الأشكال: * "الاثنين 7 أكتوبر، 2014" * "الاثنين 7 أكتوبر، 2014" * "الاثنين 7 أكتوبر، 2014" * "الاثنين 7 أكتوبر، 2014" * (وهذا يعمل أيضا مع الأسبوع مختصرة أيام مثل مو أو الاثنين ليوم الاثنين)
الاسبرانتو:
قاعدة جديدة أن يتحقق إذا كان يوم من أيام الأسبوع يطابق التاريخ، على سبيل المثال يكشف "Vendredon لا 28-وAAgusto دي 2014"، كما أن التاريخ ليس الجمعة.
الفرنسية:
تحديث القاموس العلامة POS والقاموس Hunspell إلى Dicollecte 5.2
وأضاف المزج - يمكن للحكم اتفاق الآن تقديم اقتراحات لبعض الأخطاء
وأضاف / محسنة العديد من القواعد
قاعدة جديدة أن يتحقق إذا كان يوم من أيام الأسبوع يطابق التاريخ، على سبيل المثال يكشف "vendredi 28/08/2014"، كما أن التاريخ ليس الجمعة.
الألمانية:
إصلاح NullPointerException نادرة وArrayIndexOutOfBoundsException
العديد من الانذارات الكاذبة ثابتة
قواعد المضافة وتحسين
القاعدة الجديدة بالتحقق من الأحكام دون الفعل (إيقاف افتراضيا نظرا لخطر الانذارات الكاذبة)
قاعدة جديدة أن يتحقق إذا كان يوم من أيام الأسبوع يطابق التاريخ، على سبيل المثال يكشف "Dienstag، 2014/09/29"، كما أن التاريخ ليس الثلاثاء.
تحسينات في الأداء للحصول على اقتراحات التدقيق الإملائي
الفارسي:
الدعم الأولي مضافة للالفارسية
البولندية:
وأضاف وتحسين بعض القواعد
قاعدة جديدة أن يتحقق إذا كان يوم من أيام الأسبوع يطابق التاريخ
البرتغالية:
وأضاف / محسنة العديد من القواعد
وأضاف العشرات من كلمات مركبة
الروسية:
قواعد جديدة تضاف
إصلاح سورس طلب ميزة # 38 (تحقق من وجود علامات الاقتباس مختلفة)
وأضاف عدد قليل من القواعد صديق زائف (الروسية / إنجليزي)
قاعدة جديدة أن يتحقق إذا كان يوم من أيام الأسبوع يطابق التاريخ، على سبيل المثال يكتشف "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ؟؟ & ETH؛ & الصغيرة؛ & ETH؛ & frac12؛ N & sbquo؛ N ؟؟ & ETH؛ & plusmn؛ N & اليورو، N ؟؟ 2014 & ETH؛ & sup3 ؛. "، كما أن التاريخ ليس الاثنين.
توسيع قاعدة المسكوبية مع كلمات جديدة من القاموس postag
الأسبانية:
وأضاف الجديد فئة POS Z (للأرقام مكتوبة، على سبيل المثال 'أونو'، 'دوس'، ...)
ويمكن الآن الكشف عن أرقام مكتوبة وتدار على حد سواء في توضيح والقواعد.
إصلاح بعض lemmas غير صحيحة في القاموس POS.
وأضاف الهجين chunker-disambiguator.
التاميلية:
واضاف الدعم الأولي لالتاميل. إذا لم يتم عرض الخط التاميل بشكل صحيح على جهاز الكمبيوتر الخاص بك، وكنت تستخدم نظام التشغيل Windows، قد تحتاج إلى تطبيق العمل حول وصف هنا: https://bugs.openjdk.java.net/browse/JDK-8008572
الأوكرانية:
تحديث كبير لالقاموس POS (إصلاحات وكلمات جديدة)
بعض البطاقات POS تسميتها من أجل التناسق؛ العلامات الجديدة للالاختصارات والكلمات النادرة
العديد من القواعد وإصلاحات جديدة لقواعد القائمة
قاعدة جديدة أن يتحقق إذا كان يوم من أيام الأسبوع يطابق التاريخ، على سبيل المثال يكشف "& ETH؛ & ETH؛ & frac34؛ & ETH؛ & frac12؛ & ETH؛ & الصغيرة؛ & ETH؛" N- & ETH؛ "& ETH؛ & frac34؛ & ETH؛ & ordm ؛، 7 & ETH؛ & الفقرة؛ & ETH؛ & frac34؛ & ETH؛ & sup2. 2014 "، كما أن التاريخ ليس الاثنين
تحسين الأداء تطبيع رمزية
ليبر أوفيس التكامل:
لا يحصل الخلط من قبل الحواشي في ليبر أوفيس 4.3 و في وقت لاحق (أنه يوفر لنا الآن مع المواقف الحاشية عن بيانات الوصفية، حتى نتمكن من تجاهلها).
API:
تحسينات في الأداء الرئيسية لحالة استخدام الصفحات المتعددة، حيث يحصل إنشاء JLanguageTool في موضوع، ولكن الكائن اللغة (على سبيل المثال 'الألمانية') يحصل إنشاء مرة واحدة فقط. يجب أن يكون فوق لخلق JLanguageTool الآن أقل بكثير.
إزالة عدة فئات والأساليب التي قد انتقدت منذ الإصدار 2.6
DutchSpellerRule إزالتها - استخدام MorfologikDutchSpellerRule بدلا
لقد تغيرت توقيع Language.getRelevantRules ()
منشئات JLanguageTool وMultiThreadedJLanguageTool لا تعلن بطرح IOException بعد الآن
تمت إعادة تسمية WhitespaceRule إلى MultipleWhitespaceRule (WhitespaceRule لا يزال موجودا ولكن تم إهمال)
انتقدت بعض الأساليب التي سيتم انخفضت (على سبيل المثال من القطاع العام إلى المحمية) الرؤية
تمت إعادة تسمية MorfologikSpellerRule.getRuleMatch (سلسلة، الباحث) لMorfologikSpellerRule.getRuleMatches (سلسلة، الباحث)
منشئ RuleMatch يلقي الآن استثناء إذا toPosition ليس أكبر من fromPosition
قدم TextLevelRule فئة مجردة الجديد الذي يمتد القاعدة والتي يمكن استخدامها للقواعد التي تغطي أكثر من جمل واحدة.
سطر الأوامر:
يسمح الآن تمكين وتعطيل قواعد محددة في نفس الوقت. من أجل اختبار فقط بعض القواعد (تعطيل كل ما تبقى)، الذي سبق القيام به مع "LIST_OF_RULES --enable"، والآن استخدام "LIST_OF_RULES --enable --enabledonly" (أو "-eo -e LIST_OF_RULES").
خادم جزءا لا يتجزأ من:
اثنين من الخيارات الجديدة يمكن وضعها في خصائص ملف لجعل LanguageTool إعادة تنسيق XML نفس بعد الموعد النهائي (إغاثة الملهوف). بهذه الطريقة يمكن أن تستخدم بمثابة قطرة في بديل للإغاثة الملهوف: * وضع - 'LanguageTool' أو 'AfterTheDeadline' * afterTheDeadlineLanguage - مدونة اللغة الافتراضية إذا تم تعيين الوضع ل'AfterTheDeadline' ملاحظة: ينبغي النظر في وضع "AfterTheDeadline" التجريبية في الوقت الراهن.
خيار "maxCheckThreads هو الجديد يتيح وضع أكبر عدد ممكن من المواضيع نعمل على طلبات بشكل متواز. الافتراضي هو 10، كما كانت عليه من قبل.
الداخلية:
جديد مجردة AbstractDateCheckFilter القاعدة التي تسمح للتحقق مما إذا مباراة اليوم الأسبوع والتاريخ. على سبيل المثال "الثلاثاء سبتمبر 29، 2014" يمكن أن يتم الكشف عن، و29 سبتمبر 2014 ليست في الواقع الثلاثاء. هذا يستخدم واجهة RuleFilter التجريبية الجديدة التي يمكن استدعاؤها من XML مع عنصر 'تصفية' الجديد. 'تصفية' يأخذ هذه الصفات: 'الطبقة': اسم مؤهل بشكل كامل من فئة Java التي تطبق RuleFilter، على سبيل المثال "org.languagetool.rules.de.DateCheckFilter" "وسائط": سلسلة مثل "في العام: 1 الشهر: 2 اليوم: 3 يوم من أيام الأسبوع: 4"، أي قائمة مفصولة مساحة من أزواج مفتاح / قيمة، حيث يحصل على حلها العاشر ل قيمة للنموذج رمزية (كما في عنصر 'رسالة')
يتجاهل حكم المجمع الآن الرموز التي تم تطعيمهم في disambiguation.xml
يتم تطبيق "تصفية" العمل في disambiguator الآن فقط إلى علامات POS التي تتطابق مع العلامة POS معين. إذا كانت لا تطابق، لا يتم تطبيق هذه القاعدة.
إذا كنت توسيع قواعد XML كما هو موضح في http://wiki.languagetool.org/tips-and-tricks#toc2 وسيادة والغموض الملفات الخارجية يمكن الآن استضافتها على خادم محمي بكلمة مرور عن طريق تحديد URL مثل على هذا: // المستخدم: password@example.org/path/user-rules.xml
اندفاعة م ("A & اليورو؛" ") هو الآن طابع tokenizing لجميع اللغات
ميزة جديدة:
استخدام نماذج لغة
يمكن LanguageTool الآن الاستفادة من البيانات ngram. البيانات ngram هو من المعلومات حول كيفية غالبا ما تحدث العبارات في اللغة. ، وهذا يستخدم حاليا عبارات طول 3.
يتم استخدام البيانات من قبل الحكم الإنجليزي للعثور على الأخطاء متجانسة، مثل الخلط بين الخشنة / دورة أو الذوق / مضيئة. كان LanguageTool بعض القواعد من هذا النوع من قبل، ولكن القاعدة الجديدة يدعم الآن حوالي 900 من هذه الكلمة أزواج / مجموعات.
البيانات اللازمة لهذا ضخمة (7GB للغة الإنكليزية)، وبالتالي ليست جزءا أو LanguageTool.
البيانات (الإنجليزية فقط حاليا) والمزيد من الوثائق متاحة في http://wiki.languagetool.org/finding-errors-using-big-data
باستخدام ngrams يجعل LanguageTool أبطأ قليلا عندما يتم تخزين البيانات على SSD.
إذا لم تكن مخزنة على SSD، وأداء قد تنخفض بشكل كبير.
استخدام الخيار --languagemodel جديد مع العميل سطر الأوامر لتنشيط القاعدة التي تستخدم البيانات. هذا الخيار غير متاح للقائمة بذاتها واجهة المستخدم الرسومية حتى الان.

ما هو الجديد في الإصدار 2.4.1:



تحديث المكتبات Morfologik إلى 1.8.3 لإصلاح اقتراحات بطيئة في المدقق الإملائي، والتي طالت ما لا يقل عن EN-US

ما هو الجديد في الإصدار 2.4:



البريتونية:
SRX tokenization الجملة
وأضاف / تحسين بعض القواعد
إصلاح بعض الانذارات الكاذبة
الثابتة اقتراحات غير صحيحة بفضل اختبارات إضافية على التصويبات
الكاتالونية:
وأضاف / محسنة العديد من القواعد
الانذارات الكاذبة ثابتة
الإضافات والإصلاحات التي تم إجراؤها في القاموس بلغة
إزالة بعض الكلمات من القاموس التوليف (انظر filterarchaic.txt)
وأضاف البيانات تردد إلى القاموس بلغة؛ تردد لوائح الكلمات تأتي من المشروع غايا، مع رخصة أباتشي، الإصدار 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
الإنجليزية:
وأضاف / تحسين بعض القواعد
إصلاح بعض الانذارات الكاذبة
الفرنسية:
وأضاف / محسنة العديد من القواعد
إصلاح بعض الانذارات الكاذبة
الألمانية:
وأضاف / محسنة العديد من القواعد
وأضاف المزج حكم اتفاق يمكن الآن تقديم اقتراحات لبعض الأخطاء (وليس كل الاقتراحات صحيحة، على الرغم من)
البولندية:
وأضاف / محسنة العديد من القواعد، وخاصة بالنسبة للالواصلة واندفاعة الاستخدام
معلومات تردد المضافة للقاموس التدقيق الإملائي. تردد لوائح الكلمات تأتي من المشروع غايا، مع رخصة أباتشي، الإصدار 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
إصلاح بعض الانذارات الكاذبة
البرتغالية:
وأضاف / محسنة العديد من القواعد (ويشمل الآن قواعد الجنسين "أ" / "س")
أصبح لديها الآن 3400+ كلمات مركبة
تمت إعادة تسمية ملف JAR لlanguagetool.jar، من languagetoolstandalone.jar سابقا لتفادي الخلط حول ما مستقل "تعني في هذا السياق (جيثب القضية رقم 29)
للغات مع العديد من القواعد (مثل الفرنسية أو الألمانية) الأداء على نصوص طويلة قد زاد بنحو 2030٪
إصلاح لthreadsafety (يمكن أن تسبب تعليق في MultiWordChunker)
إصلاح الخلل حيث لم يتم اختبار الشروح قطعة في مجموعات
إصلاح: 1 ولم يتم تقييمها في ...
إصلاح الخلل في آلية التوحيد أن تجاهل بعض التفسيرات مطابقة قبل الأوان
واضاف لدعم الشروح قطعة في disambiguator، والثابتة علة واحدة في الرموز تصفية مع شروح قطعة
تحديث المكتبات Morfologik إلى 1.8.2 (إصلاحات الشوائب، أكثر صرامة إدخال التعقل فحص، إضافة بيانات التردد إلى القواميس)
وأضاف خيار بما في ذلك بيانات التردد لtaggging أو هجاء القواميس. الشكل المتوقع للwordlists التردد هو واحد في المشروع غايا، مع رخصة أباتشي، الإصدار 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
أدوات سطر الأوامر الجديدة لتصدير وإنشاء قواميس ثنائية:
org.languagetool.dev.DictionaryExporter
org.languagetool.dev.POSDictionaryBuilder
ليبر أوفيس / أوبن أوفيس التكامل:
وأضاف حلا للكشف عن الجملة غير صحيحة للحالة التي ظهرت حاشية بعد وقف كامل الجملة (سورس علة # 191)
GUI مستقل:
فإن الحوار الذي فتحته "المزيد ..." عنصر في قائمة السياق من خطأ الآن عرض أيضا جمل صحيحة وغير صحيحة
API:
SentenceTokenizer الآن واجهة، تم نقل تنفيذ لRegexSentenceTokenizer، ولكن تم إهمال هذا وSRXSentenceTokenizer ينبغي أن تستخدم بدلا من ذلك
وقد تم نقل بعض الأساليب من org.languagetool.tools.StringTools إلى فئة org.languagetool.gui.Tools في المشروع languagetoolguicommons
LanguageToolListener.languageToolEventOccured () تمت إعادة تسمية لLanguageToolListener.languageToolEventOccurred ()
org.languagetool.tools.SymbolLocator ليس الجمهور بعد الآن (يجب أن لا تؤثر على أي شخص)
DanishSentenceTokenizer إزالة الذي كان قد انتقدت لمدة ثلاث سنوات
Rule.getCorrectExamples () وRule.getIncorrectExamples () لا عودة لاغية بعد الآن ولكن قائمة فارغة إذا لم تكن هناك أمثلة على ذلك. ونتيجة لذلك، setCorrectExamples () وsetIncorrectExamples () لا تقبل لاغيا بعد الآن.
Rule.getId () قد يعود أي سلسلة الآن، وليس فقط ASCIIonly سلاسل (في الواقع كان هذا هو الحال من قبل، كما أن تقييد ASCIIonly كان يطبق أبدا، وذكر فقط في جافادوك)
languagetoolwikipedia: لقد تم تبسيط خيارات سطر الأوامر لفحص تفريغ ويكيبيديا. ويمكن الآن أن يطلق عليه أمر مثل هذا: جرة جافا languagetoolwikipedia.jar checkdata ل EN و enwiki20130621pagesarticles.xml اتصل فقط "جرة جافا languagetoolwikipedia.jar checkdata" للحصول على رسالة الاستخدام. يمكن تحديد أكثر من ملف واحد مع خيار و. بالإضافة إلى ذلك إلى مقالب XML ويكيبيديا، ملفات CSV من Tatoeba (http://tatoeba.org) والآن يدعم أيضا، فإنها تحتاج لتتم تصفيته أولا لاحتواء سوى لغة ذات الصلة.

ما هو الجديد في الإصدار 2.3:



البريتونية:
وأضاف / تحسين بعض القواعد
الانذارات الكاذبة ثابتة
تحديث القاموس POS من Apertium (إس r47282)
الكاتالونية:
واضاف لدعم رمز اللغة CA-ES-فالنسيا (بلنسية التشيكية)، لاستخدامها في ليبر أوفيس 4.2.0
وأضاف لاستبدال قاعدة بسيطة مع مئات من الاقتراحات الغيار
وأضاف / محسنة العديد من القواعد
الانذارات الكاذبة ثابتة
الصينية:
وأضاف حلا لStringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
الإنجليزية:
أنماط استبدال مضافة للالمدقق الإملائي تقديم اقتراحات أفضل (تقدم الآن 'تدرس' ل 'تيتشيد')
وأضاف / تحسين بعض القواعد
الفرنسية:
وأضاف / تحسين بعض القواعد
الانذارات الكاذبة ثابتة
تحديث القاموس العلامة POS والقاموس Hunspell إلى Dicollecte-4.12
الألمانية:
وأضاف / محسنة العديد من القواعد
البرتغالية:
وأضاف / تحسين بعض القواعد
أصبح لديها الآن 3300+ كلمات مركبة
الأوكرانية:
وأضاف / محسنة العديد من القواعد
تم نقل شفرة المصدر لجيثب: https://github.com/languagetool-org/languagetool
يتطلب LanguageTool جافا 7 الآن
LanguageTool يستفيد من المواضيع متعددة الآن لنص التدقيق على الأجهزة الحديثة، وتحسين الأداء (هذا يؤثر على إصدار مستقل، وإصدار سطر الأوامر والإرشاد ليبر أوفيس / أوبن أوفيس)
حكم بناء الجملة:
الدعم الأولي للسمات جديدة دقيقة / ماكس التي تسمح لمطابقة عنصر الذي يظهر في عدد معين من المرات. على سبيل المثال: سوف فو تطابق شيئا أو "فو"، أي "فو" هو سوف فو اختياري تطابق "فو" أو "فو فو" فو سوف تطابق أي شيء، "فو"، أو "فو فو" استخدام الحد الأقصى = "- 1" السماح الحوادث غير محدودة. للدقيقة، معتمد فقط 0 أو 1 (1 هو الافتراضي).
دعم OR-البيانات. على سبيل المثال: داخليا وفي وقت التشغيل، قاعدة تحتوي OR-البيانات وتحويلها إلى عدة قواعد دون OR-البيانات.
اللغة الإنجليزية لديها الآن chunker للكشف، من بين أمور أخرى، قطع إسم المفرد والجمع. تم توثيق هذا في http://wiki.languagetool.org/using-chunks
إصدار مستقل:
الإصدار المستقل يؤكد الآن الأخطاء مع أحمر (الأخطاء الإملائية) أو الأزرق (أخطاء أخرى) خط (باناجيوتيس مينوس)
تذكر اختيار اللغة لبدء المقبل
تحسين النافذة ووضع الحوار في إعداد متعدد رصد
خادم جزءا لا يتجزأ: يستخدم المنفذ الافتراضي (8081) مرة أخرى إذا بدأت بدون وسائط
تحديث إلى الإصدار 1.7.1 مكتبة لتمكين اقتراحات أفضل، بما في ذلك التعامل السليم مع علامات التشكيل وأنماط استبدال الناجمة morfologik (المعادل من الميزات MAP وREP في قواميس hunspell)
أوبن أوفيس / ليبر أوفيس التكامل:
FIX: لم "حول" الحوار لا تعمل في أباتشي أوبن أوفيس 4.0
الإصلاح: القواعد الخاصة بكل بلد (مثل لالإنجليزية البريطانية) لم تنجح
API:
في فئة اللغة، تمت إعادة تسمية getCountryVariants () لgetCountries ()، وتمت إضافة طريقة getVariant جديدة.
وقد انتقدت بعض الطرق
وقد تم نقل بعض الأساليب من فئة أدوات (languagetool النواة) إلى فئة CommandLineTools جديدة (languagetool-فلكس)
تمت إعادة تسمية AbstractRuleDisambiguator XmlRuleDisambiguator وليس المجرد بعد الآن. تم إزالة الطبقات RuleDisambiguator، XmlRuleDisambiguator يمكن استخدامها مباشرة بدلا من ذلك.
وقد تم إدخال طريقة جديدة JLanguageTool.check (AnnotatedText) الذي يسمح لك للتحقق النص مع العلامات. استخدام AnnotatedTextBuilder لبناء الإدخال.
وقد تحسنت موضوع السلامة. حالة استخدام الموصى بها هي الآن لإنشاء كائن JLanguageTool جديد لكل موضوع، ولكن لخلق لغة مرة واحدة فقط (مثل: اللغة الإنجليزية الجديدة ()) واستخدام ذلك لجميع الحالات JLanguageTool. هذا غيرت API بعض الفئات العامة، ولكن بالنسبة للحالة استخدام معيار فحص النصوص مع JLanguageTool الاعتراض أنه لا ينبغي أن تحدث فرقا. (التصحيح عن طريق ستيفان Lotties)
JLanguageTool.loadFalseFriendRules () يتصرف الآن مثل JLanguageTool.loadPatternRules (): يبدو في مسار الدرجة الأولى، وبعد ذلك، إذا لم يتم العثور على ملف معين هناك، في نظام الملفات
عرض واجهة Chunker التي يمكن تعيين قطع (المعروف أيضا باسم العبارات) إلى الرموز. على سبيل المثال، لجمل اسمية مثل "كمبيوتر سريع" للchunker يمكن تعيين أحد "NP-المفرد" (اسم العبارة، المفرد) قطعة لكل واحد من الرموز في هذه العبارة. في grammar.xml، ويمكن بعد ذلك أن يقابل هذا المنوال مع بناء الجملة التالي:
وMultiThreadedJLanguageTool فئة جديدة يجعل من استخدام العديد من المواضيع كما كان لدى الكمبيوتر المعالجات. في تجاربنا هذا وقد تحسنت نص التدقيق الوقت بنحو 70٪ على معالج إنتل i7 عند استخدامها على النص 30KB.
AnalyzedTokenReadings تنفذ الآن Iterable لذلك يمكن استخدامها في حلقات foreach
تمت إزالة AnalyzedGermanTokenReadings، AnalyzedTokenReadings يمكن أن تستخدم بدلا من ذلك
خادم HTTP جزءا لا يتجزأ من: خادم يستخدم الآن 10 المواضيع بدلا من 1 (بفضل باناجيوتيس مينوس)
تم تحسين استخراج النص من مقالب ويكيبيديا

ما هو الجديد في الإصدار 2.2:



تم تحديث العديد من القواعد اكتشاف الخطأ، وخاصة بالنسبة الفرنسية، الكاتالانية، الألمانية، البرتغالية، الروسية، الاسبرانتو، وبريتون.
وقد تم إصلاح العديد من الحشرات الصغيرة.

ما هو الجديد في الإصدار 2.1:



ويضيف هذا الإصدار العديد من التحديثات لقواعد الكشف عن خطأ للغة الإنكليزية، الفرنسية، الألمانية، البرتغالية، الكاتالانية، البولندية، الروسية، بريتون، الاسبرانتو، والإيطالية.
LanguageTool الآن وحدات، لسهولة الاستخدام من قبل مطوري جافا.
بدلا من JAR احدة كبيرة، وهناك الآن العديد من الدول الصغيرة (قريبا يمكن العثور عليها في مخضرم الوسطى).
وقد تم إصلاح العديد من الأخطاء.

ما هو الجديد في الإصدار 2.0:



تم إضافة العديد من التحديثات لقواعد الكشف عن خطأ للغة الإنكليزية، الإسبانية، الفرنسية، الألمانية، البرتغالية، الروسية، بريتون، الكاتالانية، الاسبرانتو، والأوكرانية.
ويمكن الآن بدء تشغيل الملقم HTTP جزءا لا يتجزأ من قائمة السياق إذا LanguageTool يعمل في علبة النظام.
وقد تم إصلاح بعض الحشرات الصغيرة.

ما هو الجديد في الإصدار 1.9:



تم إضافة العديد من القواعد اكتشاف الخطأ الجديدة وتم تحديث القواعد القائمة.

المتطلبات:



جافا 2 الإصدار القياسي للبيئة وقت التشغيل

البرامج الأخرى من المطور Daniel Naber

Jwordsplitter
Jwordsplitter

21 Jan 15

LanguageTool
LanguageTool

21 Jan 15

تعليقات ل LanguageTool

لم يتم العثور على التعليقات
إضافة تعليق
بدوره على الصور!