Meta has released a new suite of AI security tools for its Llama models, aimed at making AI development safer and helping cybersecurity teams defend against threats.
Key Tools & Features:
- Llama Guard 4: A safety filter that now works with both text and images (multimodal). Integrated into Meta’s new Llama API (limited preview).
- LlamaFirewall: Acts as a control hub to coordinate different safety models and detect threats like prompt injection or unsafe code.
- Prompt Guard 2 (86M & 22M): Improved at detecting jailbreaks and prompt attacks. The lighter 22M version offers 75% lower latency and cost.
- CyberSec Eval 4: A benchmark suite to test AI’s cybersecurity performance, featuring:
- CyberSOC Eval: Evaluates AI in real-world SOC settings (developed with CrowdStrike).
- AutoPatchBench: Tests AI’s ability to find and fix vulnerabilities in code.
Other Notable Additions:
- Llama Defenders Program: Gives early or special access to Meta’s AI safety tools.
- Automated Doc Classification Tool: Classifies sensitive documents to prevent leaks or misuse in AI.
- Audio Detection Tools: Identify AI-generated fake voices in scams or phishing calls (partnered with AT&T, Bell Canada, ZenDesk).
- Private Processing (for WhatsApp): AI-powered summaries and message suggestions without compromising privacy.
Meta is also encouraging security researchers to evaluate its threat models, signaling a commitment to transparency and safety.
মেটা তাদের ল্লামা এআই মডেলের জন্য নতুন কিছু নিরাপত্তা টুল চালু করেছে, যা এআইকে আরও সুরক্ষিতভাবে ডেভেলপ এবং ব্যবহার করতে সহায়তা করবে।
মূল টুলস ও বৈশিষ্ট্যসমূহ:
- Llama Guard 4: এখন এটি শুধু টেক্সট নয়, ইমেজেও নিরাপত্তা যাচাই করতে পারে (মাল্টিমোডাল)। এটি Meta-এর নতুন Llama API-তে যুক্ত।
- LlamaFirewall: একটি নিয়ন্ত্রণ কেন্দ্র হিসেবে কাজ করে, বিভিন্ন সেফটি মডেল পরিচালনা করে এবং ঝুঁকি যেমন প্রম্পট ইনজেকশন বা অনিরাপদ কোড শনাক্ত করে।
- Prompt Guard 2 (86M ও 22M): জেইলব্রেক ও প্রম্পট অ্যাটাক ধরতে আরও কার্যকর। 22M ভার্সনটি কম লেটেন্সি ও খরচে কাজ করে।
- CyberSec Eval 4: এআই-এর সাইবার সিকিউরিটি পারফর্ম্যান্স মূল্যায়নের টুলকিট:
- CyberSOC Eval: বাস্তব SOC (সিকিউরিটি অপারেশন সেন্টার)-এ এআই কীভাবে কাজ করে তা পরিমাপ করে।
- AutoPatchBench: এআই কীভাবে কোডের দুর্বলতা খুঁজে প্যাচ করে, তা মূল্যায়ন করে।
অন্যান্য গুরুত্বপূর্ণ ফিচার:
- Llama Defenders Program: ডেভেলপার ও কোম্পানিকে প্রাথমিক বা বিশেষ অ্যাক্সেস দেয়।
- Automated Doc Classification Tool: সংবেদনশীল ডকুমেন্ট স্বয়ংক্রিয়ভাবে চিহ্নিত করে যেন ভুলভাবে ফাঁস না হয়।
- Audio Detection Tools: স্ক্যাম বা ফিশিং কলের এআই-নির্মিত ভয়েস শনাক্ত করতে পারে (AT&T, Bell Canada, ZenDesk-এর সাথে পার্টনারশিপ)।
- Private Processing (WhatsApp): মেসেজ পড়া ছাড়াই এআই দ্বারা সারাংশ তৈরি ও রিপ্লাই সাজেস্ট করার প্রযুক্তি।
মেটা তাদের থ্রেট মডেল ওপেন করে সিকিউরিটি গবেষকদের আমন্ত্রণ জানিয়েছে, যা তাদের স্বচ্ছতা ও নিরাপত্তার প্রতিশ্রুতির ইঙ্গিত দেয়।