lxml

البرمجيات قطة:
lxml
تفاصيل البرنامج:
الإصدار: 3.4.4 محدث
تاريخ إيداع: 12 May 15
المطور: infrae.com
ترخيص: حرر
شعبية: 245

Rating: 5.0/5 (Total Votes: 1)

lxml يجمع بين سرعة هذه المكتبات مع بساطة لغة بايثون.
متوافق مع جميع الإصدارات CPython 2،4-3،2

ما هو الجديد في هذا الإصدار:.

lxml.html.iterlinks الآن إرجاع الروابط داخل علامات التحديث الفوقية.
جديد collect_ids الخيار XMLParser = False لتعطيل تجزئة ID إنشاء الجدول. هذا يمكن أن تسرع إلى حد كبير حتى تحليل وثائق مع العديد من معرفات المختلفة التي لا يتم استخدامها.
يستخدم محلل في وثيقة الجداول التجزئة للمعرفات XML. وهذا يقلل من حمولة من ديكت محلل العالمي ويسرع تحليل للوثائق مع العديد من معرفات مختلفة.
ElementTree.getelementpath (عنصر) بإرجاع التعبير ElementPath الهيكلي لعنصر معين، والتي يمكن استخدامها لعمليات البحث في وقت لاحق.
xmlfile () يقبل حجة جديدة قريبة = صحيح لإغلاق ملف (تشبه) التحف بعد أن كتب لهم. من قبل، xmlfile () أغلق فقط الملف إذا كان قد فتحه داخليا.
تسمح ومثل؛ bytearray ومثل؛ اكتب لإدخال النص ASCII.

ما هو الجديد في الإصدار 3.4.2:

lxml.html.iterlinks الآن إرجاع الروابط داخل علامات التحديث الفوقية.
جديد collect_ids الخيار XMLParser = False لتعطيل تجزئة ID إنشاء الجدول. هذا يمكن أن تسرع إلى حد كبير حتى تحليل وثائق مع العديد من معرفات المختلفة التي لا يتم استخدامها.
يستخدم محلل في وثيقة الجداول التجزئة للمعرفات XML. وهذا يقلل من حمولة من ديكت محلل العالمي ويسرع تحليل للوثائق مع العديد من معرفات مختلفة.
ElementTree.getelementpath (عنصر) بإرجاع التعبير ElementPath الهيكلي لعنصر معين، والتي يمكن استخدامها لعمليات البحث في وقت لاحق.
xmlfile () يقبل حجة جديدة قريبة = صحيح لإغلاق ملف (تشبه) التحف بعد أن كتب لهم. من قبل، xmlfile () أغلق فقط الملف إذا كان قد فتحه داخليا.
تسمح ومثل؛ bytearray ومثل؛ اكتب لإدخال النص ASCII.

ما هو الجديد في الإصدار 3.3.2:

خصائص حل له ونسخة، فضلا عن أساليب set_element_class_lookup () وmakeelement ()، وضاعت من الأجسام iterparse.
لم حالات XMLSchema، Schematron وRelaxNG ليس واضحا error_log المحلي قبل تشغيل التحقق من الصحة.
lxml.doctestcompare اختلطت ومثل، ويتوقع مثل؛ و & مثل؛ الفعلية ومثل؛ في قيم السمة.

ما هو الجديد في الإصدار 3.3.1:

البق الثابتة:
وثائق HTML تحليل مع parser.feed () فشلت في العثور العناصر خلال العلامة التكرار.
بناء في PyPy فشلت بسبب عدم وجود دعم لPyUnicode_Compare () وPyByteArray _ * () في C-API PyPy ل.
تجميع في MSVC فشلت بسبب عدم وجود ومثل؛ stdint.h ومثل؛ ملف الرأس القياسية.
iterparse () فشل في تحليل BOM مسبوقة الملفات.

ما هو الجديد في الإصدار 3.3.0:

البق الثابتة:
وشددت على مجريات الأمور التي تميز مسارات الملفات من عناوين لإنتاج السلبيات أقل كاذبة.

ما هو الجديد في الإصدار 3.2.3:

الدعم الثابت لبيثون 2.4 الذي ضاع في 3.2.2.

ما هو الجديد في الإصدار 3.2.1:

طرق apply_templates () وprocess_children () من XSLT عناصر تمديد اكتسبت خيارين منطقية جديدة elements_only وremove_blank_text أن تجاهل إما كافة السلاسل أو بيضاء فقط سلاسل من قائمة النتائج.

ما هو الجديد في الإصدار 3.2.0:

القيادية بيضاء يمكن تغيير سلوك وظائف سلسلة التوزيع في lxml.html.
وظائف سلسلة التوزيع في lxml.html هي أكثر قوة في مواجهة محتوى HTML غير المألوف مثل الإطارات أو العلامات الجسم في عداد المفقودين.
I / O أخطاء أثناء محاولة الوصول إلى الملفات مع المسارات التي تحتوي على أحرف غير ASCII قد يرفع UnicodeDecodeError بدلا من تقديم التقارير بشكل صحيح IOError.
تحليل من في الذاكرة سلاسل الوصول إلى الشبكة المعاقين في محلل الافتراضية ومحاولات لاحقة لتحليل من URL تفشل.

ما هو الجديد في الإصدار 3.1.2: سمات

تمر عبر API-مساحة غير مدركين للجسر ساكس (أي طريقة handler.startElement ()) فشلت مع TypeError.
الثابتة خطأ التسلسل في الناتج XSLT عند تحويل شجرة نتيجة لسلسلة Unicode.

ما هو الجديد في الإصدار 3.0.2:

تحطم الثابتة أثناء إيقاف التشغيل مترجم عن طريق التحول إلى Cython 0.17.3 للبناء.

ما هو الجديد في الإصدار 3.0: يسمح بتحديد البادئات شاملة للترقية

C14N إلى أعلى مستوى خلال التسلسل الحصري.
الدعم الأولي للبناء في PyPy (من خلال cpyext).
اكتسبت أشياء DTD لAPI التي تتيح الوصول للقراءة إلى تصريحاتهم.
اكتسبت xpathgrep.py الدعم لتحليل خط سطرا (على سبيل المثال من البقرى الانتاج) والتي تحيط الإخراج مع علامة جذر جديدة.
E-مصنع في lxml.builder يقبل أنواع فرعية من أنواع البيانات المعروفة (مثل الأنماط الفرعية سلسلة) عند بناء عناصر من حولهم.
التكرار شجرة وiterparse () مع وسيطة العلامة انتقائية تدعم تمرير مجموعة من الأكواد. سيتم إرجاع العقد شجرة من iterators إذا كانت تتطابق مع أي من العلامات.

ما هو الجديد في الإصدار 2.3.5:

تحطم عند دمج النص العقد في element.remove ().
تحطم في ساكس محلل / الهدف عند الإبلاغ DOCTYPE فارغة.

ما هو الجديد في الإصدار 2.3.4:

تحطم عند بناء nsmap (الملكية العنصر) مع محددات مساحة فارغة.
تحطم بسبب العرق الشرط عند أخطاء (أو رسائل المستخدم) تحدث أثناء معالجة XSLT مترابطة.
XSLT الأنماط تجميع يمكن تجاهل أخطاء ترجمة.

ما هو الجديد في الإصدار 2.3.3:

ملامح وأضاف:
lxml.html.tostring () اكتسبت الجديدة خيارات التسلسل with_tail وDOCTYPE.
البق الثابتة:
تحطم طائرة ثابتة عند استخدام iterparse () للتحليل HTML والتي تطلب الأحداث البداية.
تحليل ثابت للمزيد من محددات في cssselect. بيضاء قبل الزائفة العناصر والزائفة الطبقات هي كبيرة كما هو combinator سليل. ومثل؛ E: الزائفة ومثل؛ يجب تحليل نفس ومثل؛ E *: الزائفة ومثل؛ وليس ومثل؛ E: الزائفة ومثل ؛.
lxml.html.diff لم يعد يثير استثناء عندما ضرب "IMG" به دون "SRC" السمة.

ما هو الجديد في الإصدار 2.3.2:

ملامح وأضاف:
lxml.objectify.deannotate () لديه جديد لcleanup_namespaces خيار منطقي لإزالة الإعلانات مساحة تشييء (وعموما تنظيف الإعلانات مساحة الاسم) بعد إزالة شروح النوع.
اكتسبت lxml.objectify وظيفتها الخاصة فرعي () كنسخة من etree.SubElement لتجنب استيراد زائدة عن الحاجة إلا من lxml.etree على الجانب المستخدم.
البق الثابتة:
الثابتة ومثل؛ سليل ومثل؛ خطأ في cssselect للمرة الثانية (بعد الإصلاح الأول في lxml 2.3.1). أسفر التغيير السابق في انحدار أداء خطيرة لتقييم كسباث استنادا للتعبير المترجمة. لاحظ أن هذا يكسر استخدام بعض التعبيرات كسباث ولدت كما مسارات موقع XSLT التي عملت سابقا في 2.3.1.
تحليل ثابت من بعض المنتخبات في cssselect. بيضاء بعد combinators ومثل؛ & # x3e؛ & مثل ؛، & مثل؛ + & مثل؛ و & مثل؛ ~ ومثل؛ والآن تجاهل بشكل صحيح. سابقا وكان تحليل باعتباره سليل combinator. على سبيل المثال، ومثل؛ & # شعبة x3e. .foo ومثل؛ تم تحليل نفس ومثل؛ & # شعبة x3e؛ * .foo ومثل؛ بدلا من & مثل؛ & # شعبة x3e؛ .foo & مثل ؛.

ما هو الجديد في الإصدار 2.3.1:

ملامح وأضاف:
kill_tags الخيار الجديد في lxml.html.clean لإزالة علامات معينة ومضمونها (أي الشجرة بكاملها).
pi.get () وpi.attrib بناء على تعليمات المعالجة لتحليل الزائفة سمات من محتوى النص من تعليمات المعالجة.
lxml.get_include () إرجاع قائمة تشمل المسارات التي يمكن استخدامها لترجمة التعليمات البرمجية C خارجي ضد lxml.etree. هذا هو المطلوب تحديدا لlxml مرتبطة بشكل ثابت يبني عندما يحتاج رمز لتجميع ضد بالضبط نفس الإصدارات ملف الرأس كما lxml نفسها.
Resolver.resolve_file () يأخذ close_file خيار إضافي بتكوين إذا كان سيتم إغلاق (تشبه) كائن ملف بعد قراءة أم لا. افتراضيا، سيتم إغلاق الملف، كما لا يتوقع المستخدم للحفاظ على الإشارة إلى ذلك.
البق الثابتة:
لم التنظيف HTML لا يزيل "البيانات: 'الروابط.
يستخدم التكامل html5lib محلل الآن تنفيذ "الرسمي" في html5lib نفسها، الأمر الذي يجعل من العمل مع أحدث الإصدارات من المكتبة.
في lxml.sax، يمكن endElementNS () رفض بشكل غير صحيح اسم العلامة عادي عند الاستدلال الحدث بداية المقابلة نفس عادي اسم العلامة أن تكون في مساحة الاسم الافتراضية.
عندما يتم تمرير كائن مثل ملف مفتوح إلى تحليل () أو iterparse ()، ومحلل لم يعد إغلاقه بعد الاستعمال. هذا يعود تغييرا في lxml 2.3 فيها كل الملفات ستغلق. وتقع على عاتق المستخدمين لإغلاق بشكل صحيح الكائن الملف (تشبه)، وأيضا في حالات الخطأ.
خطأ التوكيد في lxml.html.cleaner عندما نبذ عناصر على مستوى عال.
في lxml.cssselect، استخدم كسباث 'A // B' (قصيرة ل 'A / أصل أفريقي أو الذات :: عقدة () / B') بدلا من 'A / أصل أفريقي :: B' للمنتخب المغلق سليل ( 'الف باء'). وهذا يجعل عدد قليل من الحالات حافة أن تكون متسقة مع سلوك محدد في بكت وفايرفوكس، ويزيد من التعبيرات المغلق مسارات موقع صالحة (للاستخدام في كسسل: مباراة قالب).
في lxml.html، غير المحددة & # x3c، الخيار & # x3e. به لم تعد تظهر في شكل القيم التي تم جمعها.
إضافة / إزالة & # x3c، الخيار & # x3e. القيم إلى / من عدة حدد حقل النموذج يختار بشكل صحيح لهم وunselects لهم.
تغييرات أخرى:
ثابت يبني يمكن تحديد الدليل التحميل مع خيار --download دير.

ما هو الجديد في الإصدار 2.3:

ملامح وأضاف:
عندما تبحث عن الأطفال، lxml.objectify يأخذ '{} علامة' بأنها تعني على مساحة اسم فارغة، بدلا من مساحة الاسم الأم.
البق الثابتة:
عندما انتهيت من قراءة من كائن مثل الملفات، محلل يدعو لها طريقة .close () على الفور.
عند الانتهاء من تحليل، iterparse () على الفور إغلاق ملف الإدخال.
عمل في جميع أنحاء لlibxml2 الخلل الذي يمكن أن تترك محلل HTML في حالة غير وظيفية بعد تحليل وثيقة كسر بالقسوة (الثابتة في libxml2 2.7.8).
يدعى العلامة انطلاقها في HTML رمز تنظيف بشكل صحيح سرادق.
تغييرات أخرى:
بعض الوظائف العامة في C-API على مستوى Cython لها أنواع عودة أكثر وضوحا.

ما هو الجديد في النسخة 2.3beta1:

البق الثابتة:
تحطم في الإصدارات الأحدث libxml2 عندما تتحرك العناصر بين الوثائق التي لديها سمات على العقد XInclude استبدالها.
وظيفة XMLID () كان في عداد المفقودين محلل وbase_url المعلمات الاختيارية.
البحث عن علامات البدل في iterparse () كانت مكسورة في PY3.
لم lxml.html.open_in_browser () لا تعمل في بيثون 3 بسبب استخدام os.tempnam. عليه الآن يأخذ "ترميز" المعلمة اختيارية.

برامج مماثلة

pyregion
pyregion

13 May 15

rarfile
rarfile

13 Apr 15

colormath
colormath

21 Jul 15

py
py

13 May 15

تعليقات ل lxml

لم يتم العثور على التعليقات
إضافة تعليق
بدوره على الصور!