وضعت DataFu في ينكدين وهو مكتوب تماما في جاوة.
وDataFu تشمل وظائف / مكتبات للعمل مع:
- الاحصائيات
- تقدير
- أخذ العينات
- جلسات
- تحليل الارتباط
- مجموعة العمليات
- حقائب
وDataFu مثالية لاستخراج البيانات والتطبيقات الإحصائية العمل على رأس قواعد بيانات Hadoop أو خنزير.
وهذه الوظائف تسمح للمطورين لتحقيق الاستفادة الكاملة من جميع البيانات المخزنة داخل قاعدة بيانات Hadoop أو الخنزير دون الحاجة للتعامل مع متطلبات نظام ضخمة من أجل القيام بذلك.
ما هو جديد في هذا الإصدار:
زوج من UDFS لأخذ العينات العشوائية البسيطة مع الاستبدال.
المزيد من تبعيات تعبئتها الآن في DataFu حتى أقل تبعيات JAR المطلوبة.
SetDifference UDF لحساب مجموعة فرق (مثل A-B أو A-B-C).
ما هو الجديد في النسخة 1.2.0:
زوج من UDFS لأخذ العينات العشوائية البسيطة مع الاستبدال.
المزيد من تبعيات تعبئتها الآن في DataFu حتى أقل تبعيات JAR المطلوبة.
SetDifference UDF لحساب مجموعة فرق (مثل A-B أو A-B-C).
ما هو الجديد في النسخة 1.1.0:
واضاف SHA تجزئة UDF.
InUDF وAssertUDF المضافة للخنزير 0.12 التوافق. هذه هي نفس ووتأكيد.
SimpleRandomSample، التي تنفذ قابلة بسيطة خوارزمية أخذ العينات العشوائية.
لم يتم العثور على التعليقات