lxml

البرمجيات قطة:
lxml
تفاصيل البرنامج:
الإصدار: 3.4.1
تاريخ إيداع: 17 Feb 15
المطور: Martijn Faassen
ترخيص: حرر
شعبية: 12

Rating: nan/5 (Total Votes: 0)

وlxml هو وحدة بيثون متطورة وقوية وحرة وفريدة من نوعها التي تربط المكتبات libxml2 وlibxslt، مما يسمح للمطورين بيثون للعمل مع كل من XML و HTML ملفات الداخل من بيثون code.An معالجة XML librarylxml هو XML (لغة التوصيف الموسعة ) تجهيز مكتبة كتب في لغة البرمجة بايثون، والمصممة خصيصا لمتابعة API مواصفات ElementTree قدر الإمكان.
فإنه يمكن تمديد API ElementTree لفضح وظائف محددة من libxslt وlibxml2 المكتبات، مثل الاسترخاء NG (الجيل القادم)، كسباث، XML مخطط، c14n، XSLT (لغة صفحات الأنماط الموسعة)، etc.Use lxml لدعوة من بيثون مدونة سوف stylesheetsDevelopers XSLT تكون قادرة على استخدام البرنامج lxml للاتصال كود بايثون من الأنماط XSLT والتعابير كسباث وظائف عن طريق التمديد. وهناك مجموعة واسعة من البرامج التعليمية ويمكن الاطلاع على المشروع و؛ [س] موقع (انظر الرابط في نهاية المقال).
البرنامج مفتوح المصدر عن طريق تصميم ويجمع بين اكتمال ميزة وسرعة المكتبات المذكورة أعلاه مع بساطة بيثون و [رسقوو]؛ التي ق API (واجهة برمجة التطبيقات) .Getting مع lxmlIt من السهل جدا لتثبيت lxml على توزيع جنو / لينكس باستخدام أرشيف مصدر موزعة على Softoware ومشروع و؛ [س] الموقع الرسمي. ببساطة تحميل حزمة مصدر، حفظه على دليل الصفحة الرئيسية الخاصة بك، فك عليه، افتح التطبيق المحطة الطرفية وانتقل إلى الموقع من ملفات الأرشيف المستخرجة (مثل قرص /home/softoware/lxml-3.4.1).
تشغيل وسقوو]، وجعل و[رسقوو]؛ الأمر لترجمة البرنامج، والتي ينبغي أن يستغرق حوالي 1-2 دقائق على الكمبيوتر الحديثة. بعد تجميع ناجحة، تشغيل وسقوو]؛ جعل تثبيت و [رسقوو]؛ الأمر كجذر أو وسقوو]؛ سودو جعل تثبيت & [رسقوو]؛ الأمر كمستخدم متميز لتثبيت wide.Supports نظام lxml ويدعم جنو / لينكس والتشغيل Microsoft Windows systemsThe البرمجيات رسميا على جنو / لينكس وأنظمة تشغيل Microsoft Windows. وقد تم اختباره بنجاح على أجهزة الكمبيوتر 32 بت و 64 بت

ما هو الجديد في هذا الإصدار:.

ميزات وأضاف:
جديد مولد htmlfile HTML لمرافقة تدريجي API xmlfile التسلسل. التصحيح عن طريق بوراك أرسلان.
البق الثابتة:
لم lxml.sax.ElementTreeContentHandler لا التهيئة الفائقة لها.

ما هو الجديد في الإصدار 3.3.1:

البق الثابتة:
LP # 1014290: وثائق HTML تحليل مع parser.feed () فشلت في العثور العناصر خلال العلامة التكرار.
LP # 1273709: بناء في PyPy فشلت بسبب المفقودين الدعم لPyUnicode_Compare () وPyByteArray _ * () في C-API PyPy ل.
LP # 1274413: تجميع في MSVC فشلت بسبب المفقودين ومثل، stdint.h ومثل. ملف الرأس القياسية.
LP # 1274118: iterparse () فشل في تحليل BOM مسبوقة الملفات.

ما هو جديد في الإصدار 3.0 ألفا 2:

ميزات وأضاف:
طريقة .iter () من عناصر يقبل الآن الحجج العلامة مثل ومثل؛ {*} اسم ومثل. للبحث عن العناصر مع اسم محلي معين في أي مساحة. مع هذا بالإضافة إلى ذلك، كافة تركيبات من أحرف البدل يعمل الآن كما هو متوقع: ومثل؛ {نانوثانية} اسم ومثل ؛، & مثل؛ {} اسم ومثل ؛، & مثل؛ {*} اسم ومثل ؛، & مثل؛ {نانوثانية} * & مثل ؛، & مثل؛ {} * ومثل. وو مثل؛ {*} * & مثل ؛. لاحظ أن ومثل، اسم ومثل. ما يعادل & مثل؛ {} اسم ومثل ؛، ولكن ومثل؛ * ومثل. هو ومثل؛ {*} * & مثل ؛. وينطبق التغيير نفسه إلى .getiterator ()، .itersiblings ()، .iterancestors ()، .iterdescendants ()، .iterchildren () و.itertext () طرق، وstrip_attributes ()، strip_elements () وstrip_tags () وظائف فضلا عن iterparse () فئة.
C14N يسمح تحديد البادئات شاملة ليتم ترقيته إلى المستوى الأعلى خلال التسلسل الحصري.
البق الثابتة:
تمرير سلاسل Unicode طويلة في تغذية () واجهة محلل فشل في قراءة السلسلة بأكملها.

ما هو الجديد في الإصدار 2.3.5:

تحطم عند دمج العقد النص في element.remove ().
تحطم في ساكس محلل / الهدف عند الإبلاغ DOCTYPE فارغة.

ما هو الجديد في الإصدار 2.3.4:

تحطم عند بناء nsmap (الملكية العنصر) مع محددات مساحة فارغة.
تحطم على أساس العرق الشرط عند أخطاء (أو الرسائل المستخدم) تحدث أثناء معالجة XSLT مترابطة.
XSLT الأنماط تجميع يمكن تجاهل أخطاء ترجمة.

ما هو الجديد في الإصدار 2.3.2:

ميزات وأضاف:
lxml.objectify.deannotate () لديه الجديد لcleanup_namespaces خيار منطقي لإزالة الإعلانات مساحة تشييء (وعموما تنظيف الإعلانات مساحة الاسم) بعد إزالة شروح النوع.
اكتسبت lxml.objectify وظيفتها الخاصة عنصر فرعي () كما نسخة من etree.SubElement لتجنب استيراد زائدة غير ذلك من lxml.etree على الجانب المستخدم.
البق الثابتة:
إصلاح ومثل، وسليل مثل؛ خطأ في cssselect للمرة الثانية (بعد الإصلاح الأول في lxml 2.3.1). نتج عن التغيير السابق في الانحدار أداء خطيرة لتقييم كسباث استنادا للتعبير المترجمة. لاحظ أن هذا يكسر استخدام بعض التعابير كسباث ولدت كما مسارات موقع XSLT التي عملت سابقا في 2.3.1.
إعراب ثابت من بعض محددات في cssselect. بيضاء بعد combinators ومثل. وGT؛ & مثل ؛، & مثل؛ + & مثل. وو مثل؛ ~ ومثل؛ والآن تجاهل بشكل صحيح. سابقا وكان تحليل باعتباره سليل combinator. على سبيل المثال، ومثل، وشعبة GT. .foo ومثل. تم تحليل نفس ومثل، وشعبة GT؛ * .foo ومثل. بدلا من ومثل، وشعبة GT، .foo & مثل ؛.

ما هو الجديد في الإصدار 2.3.1:

ميزات وأضاف:
kill_tags الخيار الجديد في lxml.html.clean لإزالة علامات محددة ومحتواها (أي الشجرة بكاملها).
pi.get () وpi.attrib بناء على تعليمات المعالجة لتحليل الزائفة سمات من محتوى النص من تعليمات المعالجة.
lxml.get_include () إرجاع قائمة تشمل المسارات التي يمكن استخدامها لترجمة التعليمات البرمجية C خارجي ضد lxml.etree. هذا مطلوب على وجه التحديد لlxml مرتبطة بشكل ثابت يبني عندما يحتاج كود تجميع ضد بالضبط نفس الإصدارات ملف الرأس كما lxml نفسها.
Resolver.resolve_file () يأخذ close_file خيار إضافي بتكوين إذا كان سيتم إغلاق (تشبه) كائن ملف بعد قراءة أم لا. افتراضيا، سيتم إغلاق الملف، كما لا يتوقع المستخدم للحفاظ على الرجوع إلى النص.
البق الثابتة:
لم التنظيف HTML تقم بإزالة "البيانات:" الروابط.
يستخدم التكامل html5lib محلل الآن تنفيذ "الرسمي" في html5lib نفسه، والذي يجعل من العمل مع الإصدارات الأحدث من المكتبة.
في lxml.sax، يمكن endElementNS () يرفض بشكل غير صحيح اسم العلامة عادي عند الاستدلال الحدث بداية المقابلة نفس عادي اسم العلامة أن تكون في مساحة الاسم الافتراضية.
عندما يتم تمرير كائن مثل ملف مفتوح في تحليل () أو iterparse ()، ومحلل لم يعد إغلاقه بعد الاستعمال. هذا يعود إلى تغيير في lxml 2.3 فيها كل الملفات ستغلق. وتقع على عاتق المستخدمين لإغلاق بشكل صحيح الكائن الملف (تشبه)، وأيضا في حالات الخطأ.
خطأ التوكيد في lxml.html.cleaner عندما نبذ عناصر على مستوى عال.
في lxml.cssselect، استخدم كسباث 'A // B "(قصيرة ل' A / أصل أفريقي أو الذات :: عقدة () / B ') بدلا من' A / أصل أفريقي :: ب 'لاختيار المغلق سليل ( 'الف باء'). وهذا ما يجعل حالات قليلة حافة أن تكون متسقة مع سلوك محدد في بكت وفايرفوكس، ويجعل المزيد من تعبيرات المغلق مسارات موقع صالحة (للاستخدام في XSL: مباراة قالب).
في lxml.html، والعلامات غير المحدد لم تعد تظهر في شكل القيم التي تم جمعها.
إضافة / إزالة القيم إلى / من متعددة حدد حقل النموذج يختار بشكل صحيح وunselects لهم.
تغييرات أخرى:
ثابت يبني يمكن تحديد الدليل التحميل مع خيار --download دير.

ما هو الجديد في الإصدار 2.3:

ميزات وأضاف:
عندما تبحث عن الأطفال، lxml.objectify يأخذ '{} كلمة دلالية' بأنها تعني مساحة اسم فارغة، بدلا من مساحة الاسم الأم.
البق الثابتة:
عندما انتهيت من قراءة من كائن مثل الملفات، محلل يدعو لها طريقة .close () على الفور.
عند الانتهاء من تحليل، iterparse () على الفور يغلق ملف الإدخال.
عمل حول لlibxml2 الخلل الذي يمكن أن تترك محلل HTML في حالة غير وظيفية بعد تحليل وثيقة كسر بالقسوة (الثابتة في libxml2 2.7.8).
يدعى العلامة إذنا في HTML رمز تنظيف بشكل صحيح سرادق.
تغييرات أخرى:
بعض الوظائف العامة في C-API على مستوى Cython لها أنواع عودة أكثر وضوحا.

ما هو الجديد في الإصدار 2.2.8 / 2.3 بيتا 1:

تحطم في الإصدارات الأحدث libxml2 عندما تتحرك العناصر بين الوثائق التي لديها سمات على العقد XInclude استبدالها.
وظيفة XMLID () كان في عداد المفقودين محلل وbase_url المعلمات الاختيارية.
البحث عن علامات البدل في iterparse () كانت مكسورة في PY3.
لم lxml.html.open_in_browser () لا تعمل في بيثون 3 بسبب استخدام os.tempnam. عليه الآن يأخذ "ترميز" المعلمة اختيارية.

المتطلبات:

بيثون

برامج مماثلة

xsd2db
xsd2db

3 Jun 15

metaf2xml
metaf2xml

10 Mar 16

Atomsphere
Atomsphere

14 Apr 15

البرامج الأخرى من المطور Martijn Faassen

z3c.relationfield
z3c.relationfield

14 Apr 15

hurry.resource
hurry.resource

11 May 15

تعليقات ل lxml

لم يتم العثور على التعليقات
إضافة تعليق
بدوره على الصور!