Sarvam Vision
Leading performance on global benchmarks; best-in-class accuracy for Indian languages.

Introduction
Today, we are introducing Sarvam Vision. We have released models and applications across voice and text. With this release, we extend that work to vision. We live in a multimodal world, and vision is a crucial modality to ensure all perception problems can be solved for users and enterprises. Some of these problems surround document intelligence, general vision ("What am I seeing?") capabilities, among many others.
As part of the sovereign model series, we introduce a 3B-parameter state-space vision-language model. The model is capable of a range of visual understanding tasks, including image captioning, scene text recognition, chart interpretation, and complex table parsing.
A central challenge in vision today is high-accuracy document intelligence, particularly for Indian languages. Much of India's knowledge remains embedded in physical documents, scanned archives, and historical collections. This is knowledge locked in plain sight. Unlocking this material is essential for long-term preservation, access, and reuse across research, governance, and enterprise workflows.
Frontier Vision Language Models have established a high bar for processing modern English documents. However, a significant gap remains in the industry: most global models treat Indian languages as secondary, often resulting in lower accuracy for regional scripts. Along with pushing the frontiers of accuracy, our VLM is an inference-efficient 3B state-space model.
Model Training, Performance, and Benchmarks
At a high-level, our document intelligence architecture comprises the sovereign VLM and two harness modules - (a) semantic layout parser and (b) reading order network. The primary advances we made were for data curation and training algorithms.
The data curation effort underwent a rigorous process of creating high-quality synthetic and real-world document image-text samples for all Indian languages, alongside English. The data consisted of various domains like scientific literature, financial documents, government bulletins, historical manuscripts, textbooks, magazines, newspapers, among others. Each domain underwent data generation tailored to the specific use case. For example, in the case of chart understanding, our data consisted of chart-text pairs for a variety of tasks - like structured extraction, description, analysis. In the case table parsing, we built datasets that focus on structure and relationship recognition of the table cells.
On the algorithmic side, we performed a round of continual pretraining on the base Sarvam sovereign 3B model; followed by supervised fine-tuning and reinforcement learning using verifiable rewards.
Global Benchmarks
olmOCR-Bench
A benchmark for evaluating document-level OCR that performs pass-fail unit tests which are simple, unambiguous, and deterministically machine-verifiable. For the evaluation, we filtered out 1,258 samples out of 1,403 total samples in order to ensure the benchmarking is performed only on English documents.olmOCR-Bench-English. The implementation details can be found in this
github repository.
| Category | Sarvam Vision | Mistral OCR 3 | Chandra | Gemini 3 Pro | PaddleOCR VL 1.5 | PaddleOCR VL | DeepSeek OCR v2 | Gemini 3 Flash | GPT 5.2 |
|---|---|---|---|---|---|---|---|---|---|
| ArXiv Math | 86.5 | 85.4 | 81.4 | 70.6 | 85.4 | 85.4 | 81.9 | 66.5 | 61 |
| Base | 99.6 | 99.9 | 99.8 | 99.8 | 98.8 | 98.6 | 99.8 | 99.8 | 99.8 |
| Hdr/Ftr | 96.3 | 93.8 | 88.8 | 84 | 96.9 | 96.9 | 95.6 | 83.8 | 75.6 |
| TinyTxt | 91 | 88.9 | 91.9 | 90.3 | 80.8 | 80.8 | 88.7 | 88.2 | 62.2 |
| MultCol | 82.2 | 82.1 | 82.9 | 79.2 | 82.6 | 82.5 | 83.6 | 73.7 | 70.2 |
| OldScan | 49.8 | 48.8 | 49.2 | 47.5 | 39.2 | 38.8 | 33.7 | 46 | 34.6 |
| OldMath | 81 | 68.3 | 73.6 | 84.9 | 66.4 | 66.4 | 68.8 | 85.8 | 75.8 |
| Tables | 88.3 | 86.1 | 88.2 | 84.9 | 84.1 | 83.9 | 78.1 | 75.9 | 79 |
olmOCR (Category-wise Performance Comparison)
OmniDocBench V1.5
A comprehensive benchmark for evaluating document parsing, featuring various document and layout types (academic papers, financial reports, and handwritten notes). We report the performance on the official English-only split from the evaluation set which contains 628 samples.
OmniDocBench V1.5 (Category-wise Performance Comparison)
Sarvam Indic OCR Bench
Global benchmarks focus heavily on English document parsing, and at present there is no Indic benchmark of similar standard to the best of our knowledge. We bridge this gap by creating Sarvam Indic OCR Bench which contains 20,267 samples from various document pages. The sample set is distributed across 22 official Indian languages - ranging from 1800-present and with varying quality of scans and content. Furthermore, they are curated at a semantic block-level to robustly evaluate character and word accuracy. We report word accuracy in this section which is computed as 100 x (1 - WER).
Language-wise accuracy on Sarvam Indic OCR Bench across all 22 scheduled Indian languages
| Language | Sarvam Vision | Gemini 3 Pro | GCV | Opus 4.5 | Surya | Gemma3-27B | GPT 5.2 |
|---|---|---|---|---|---|---|---|
| Hindi | 95.91 | 95.12 | 90.94 | 93.08 | 81.85 | 85.57 | 84.86 |
| Bengali | 92.61 | 90.79 | 88.23 | 83.76 | 70.82 | 65.07 | 70.52 |
| Tamil | 93.42 | 92.73 | 89.69 | 89.62 | 75.92 | 77.14 | 61.87 |
| Telugu | 87.70 | 85.32 | 82.58 | 71.28 | 58.77 | 53.88 | 35.70 |
| Marathi | 93.13 | 90.39 | 87.86 | 81.66 | 72.29 | 70.61 | 63.81 |
| Malayalam | 91.60 | 87.10 | 88.30 | 82.88 | 83.80 | 20.03 | 56.66 |
| Kannada | 89.89 | 87.36 | 85.54 | 77.41 | 68.05 | 45.99 | 26.49 |
| Odia | 81.95 | 75.39 | 82.20 | 57.22 | 61.16 | -9.54 | 10.53 |
| Punjabi | 92.28 | 89.29 | 88.10 | 85.91 | 71.75 | 40.83 | 59.98 |
| Gujarati | 90.74 | 88.40 | 81.63 | 77.53 | 68.02 | 62.62 | 53.45 |
| Urdu | 87.01 | 85.76 | 81.17 | 77.89 | 55.17 | 64.97 | 57.49 |
| Sindhi | 90.24 | 86.31 | 86.71 | 71.89 | 61.31 | 56.69 | 49.00 |
| Santhali | 80.32 | 64.02 | 54.79 | 36.62 | 31.24 | 36.37 | 27.44 |
| Sanskrit | 81.65 | 76.62 | 64.90 | 4.25 | 44.77 | 34.85 | -21.22 |
| Nepali | 93.90 | 93.61 | 91.43 | 84.73 | 80.94 | 79.91 | 67.63 |
| Manipuri | 90.11 | 89.33 | 82.50 | 59.03 | 67.09 | 65.68 | 3.26 |
| Maithili | 81.95 | 50.96 | 49.04 | 26.07 | 1.94 | 3.16 | 13.68 |
| Konkani | 91.10 | 89.96 | 83.02 | 78.26 | 71.96 | 53.13 | 35.73 |
| Kashmiri | 55.93 | 44.46 | 33.41 | 29.89 | 9.76 | -18.03 | -0.60 |
| Dogri | 82.61 | 79.73 | 72.46 | 48.92 | 59.41 | 47.38 | 6.08 |
| Bodo | 89.19 | 87.21 | 78.64 | 62.60 | 68.04 | 55.76 | 34.19 |
| Assamese | 88.74 | 85.36 | 84.50 | 77.58 | 75.76 | 39.90 | 52.71 |
Core Document Intelligence Capabilities
Text Extraction โ Knowledge Extraction
Sarvam Vision fundamentally rethinks document intelligence as a knowledge extraction problem, while most alternatives stop at text extraction. Documents are more than words - they contain tables and visual elements like complex scientific charts, illustrations, and infographics. To truly extract all knowledge, any document intelligence model must attend to each and every pixel going beyond text. Sarvam Vision interprets visual logic that holds all information together. Whether it is extracting data points from a trend line or preserving a nested table, the model performs high-fidelity knowledge extraction end-to-end.
Illustrations of Various Domains
1. OCR on English + all 22 scheduled Indian languages

have knowledge of some vacant "Consulate" or "Special Service", that my Record and Endorsements would warrant my filling to the advantage of the Government A Knowledge of your Selection and appointment of Such only as are most fitting for the place regarded of politics or local influence has prompted me you and myself to look to you Mr President for that just consideration we have failed to secure at other hands, With the assurance of two having their Countrys welfare more at heart than their own personal interest believe us Mr President ## Your Obt Servants Wm H. Young and native of Erie County New York Wife F Rowland Young native of St Markes Florida address P.O. box 565 Washington DC

Example 1

32 เฎชเฏเฎฐเฎฎเฏเฎนเฎธเฏเฎตเฎฐเฏเฎชเฎฎเฏ. เฎเฎเฏเฎเฏ เฎ เฎเฏเฎทเฎฐเฎเฏเฎเฎณเฏ, เฎเฎเฏเฎเฎพเฎฐเฎฎเฏ. เฎเฎคเฏ เฎ เฎฑเฎฟเฎจเฏเฎคเฎตเฎฉเฏ เฎเฎคเฏเฎฎ เฎชเฏเฎฐเฎเฏเฎฐเฏเฎคเฎฟ, เฎชเฏเฎฐเฎฎเฏเฎนเฎฎเฎฑเฎฟเฎจเฏเฎคเฎตเฎฉเฏ. เฎ เฎตเฎฉเฏ เฎฎเฏเฎเฏเฎทเฎฎเฎเฏเฎเฎฟเฎฑเฎพเฎฉเฏ. เฎเฎฎเฏ เฎชเฏเฎฐเฎฎเฏเฎนเฎฎเฏ, เฎจ. เฎตเฎฟเฎทเฏเฎฃเฏ, เฎฎ. เฎฐเฏเฎคเฏเฎฐเฎฉเฏ, เฎจ. เฎเฎเฏเฎตเฎฐเฎฉเฏ, เฎฐ. เฎ เฎฃเฏเฎเฎตเฎฟเฎฐเฎพเฎเฏ, เฎฏ. เฎชเฏเฎฐเฏเฎทเฎฉเฏ, เฎฃ. เฎชเฎเฎตเฎพเฎฉเฏ, เฎฏ. เฎชเฎฐเฎฎเฎพเฎคเฏเฎฎเฎพ. (เฎชเฏเฎฐเฎฎเฏเฎน, เฎตเฎฟเฎทเฏเฎฃเฏ, เฎฐเฏเฎคเฏเฎฐ, เฎ เฎฃเฏเฎ เฎตเฎฟเฎฐเฎพเฎเฏ, เฎชเฏเฎฐเฏเฎทเฎฉเฏ, เฎชเฎเฎตเฎพเฎฉเฏ, เฎชเฎฐเฎฎเฎพเฎคเฏเฎฎเฎพ) เฎเฎฉ เฎ เฎฐเฏเฎคเฏเฎคเฎฎเฏ. เฎ , เฎ, เฎฎ เฎชเฎฟเฎจเฏเฎคเฏ, เฎจเฎพเฎคเฎฎเฏ, เฎเฎฒเฏ, เฎเฎฒเฎพเฎคเฏเฎฐเฎฎเฏ, เฎชเฎฐเฎฎเฏ, เฎคเฎพเฎฐเฎเฎชเฏเฎฐเฎฎเฏเฎนเฎฎเฏ, เฎเฎฉ เฎเฎตเฏเฎเฎณเฏ เฎเฎชเฎพเฎธเฎฟเฎเฏเฎเฎตเฏเฎฃเฏเฎฎเฏ. เฎ . เฎชเฏเฎฐเฎฎเฏเฎนเฎพ-เฎเฎพเฎฎเฏเฎชเฎตเฎพเฎฉเฏ, เฎ. เฎเฎชเฏเฎจเฏเฎคเฎฟเฎฐเฎฉเฏ-เฎนเฎฐเฎฟเฎจเฎพเฎฏเฎเฎฐเฏ, เฎฎ-เฎเฎฟเฎตเฎฉเฏ-เฎนเฎจเฏเฎฎเฎพเฎฉเฏ, เฎชเฎฟเฎจเฏเฎคเฏ-เฎเฎเฏเฎตเฎฐเฎฉเฏ -เฎเฎคเฏเฎเฏเฎฉเฎฉเฏ, เฎจเฎพเฎคเฎฎเฏ-เฎตเฎฟเฎฐเฎพเฎเฏ-เฎชเฎฐเฎคเฎฉเฏ, เฎเฎฒเฎพ-เฎชเฏเฎฐเฏเฎทเฎฉเฏ-เฎฒเฎเฏเฎทเฏ เฎฎเฎฃเฎฉเฏ, เฎเฎฒเฎพเฎคเฏเฎฐเฎฎเฏ-เฎธเฏเฎคเฎพ, เฎชเฎฐเฎฉเฏ-เฎชเฎฐเฎฎเฎพเฎคเฏเฎฎเฎพ-เฎฐเฎพเฎฎเฎฐเฏ, เฎเฎตเฏเฎตเฎฟเฎคเฎฎเฏ, เฎเฎฎเฏ เฎเฎฉเฏเฎฑ เฎเฎจเฏเฎค เฎ เฎเฏเฎทเฎฐเฎคเฏเฎคเฏเฎฏเฏ เฎฐเฎฟเฎเฏเฎตเฏเฎคเฎฎเฏ, เฎฏเฎเฏเฎฐเฏเฎตเฏเฎคเฎฎเฏ เฎเฎฉเฏเฎชเฎคเฏ, เฎฏเฎพเฎเฏเฎเฎตเฎฒเฏเฎเฏเฎฏเฎฐเฏ เฎชเฎฐเฎคเฏเฎตเฎพเฎเฎฐเฏ เฎเฏเฎเฏเฎเฎคเฏเฎฎเฏ เฎเฎคเฏเฎตเฏ. เฎเฎจเฏเฎค เฎฎเฎจเฏเฎคเฏเฎฐเฎคเฏเฎคเฎพเฎฒเฏ เฎเฎเฏเฎตเฎฐเฎฉเฏ เฎชเฏเฎฐเฏเฎคเฎฟ เฎ เฎเฏเฎเฎฟเฎฑเฎพเฎฉเฏ เฎเฎฉเฏเฎฑเฎคเฏเฎฎเฏ, เฎฏเฎพเฎเฏเฎเฎตเฎฒเฏเฎเฏเฎฏเฎฐเฏ เฎเฏเฎฉเฏเฎฉเฎพเฎฐเฏ. เฎชเฎฐเฎฎเฎพเฎคเฏเฎฎเฎพ, เฎจเฎพเฎฐเฎพเฎฏเฎฃเฎฐเฏ, เฎเฎพเฎฎเฏเฎชเฎตเฎพเฎฉเฏ, เฎนเฎจเฏเฎฎเฎพเฎฉเฏ, เฎเฎคเฏเฎฐเฏเฎเฏเฎฉเฎฉเฏ, เฎชเฎฐเฎคเฎฉเฏ, เฎฒเฎเฏเฎทเฏเฎฎเฎฃเฎฉเฏ, เฎธเฏเฎคเฏ, เฎฐเฎพเฎฎเฎฉเฏ เฎเฎตเฎฐเฏเฎเฎณเฏ เฎจเฎฎเฎธเฏเฎเฎฐเฎฟเฎเฏเฎเฎฟเฎฑเฏเฎฉเฏ. เฎเฎฉเฎเฏ เฎเฏเฎฒเฏเฎฒเฎตเฏเฎฃเฏเฎฎเฏ. เฎเฎคเฏเฎตเฏ เฎเฎเฏเฎเฏเฎตเฎฟเฎค เฎฎเฎจเฏเฎคเฏเฎฐเฎฎเฎพเฎ เฎเฎณเฏเฎณเฎคเฏ. เฎเฎคเฏ เฎเฎตเฎฉเฏ เฎ เฎคเฏเฎคเฎฟเฎฏเฎฏเฎฉเฎฎเฏ เฎเฏเฎฏเฏเฎเฎฟเฎฑเฎพเฎฉเฏ? เฎ เฎตเฎฉเฏ เฎ เฎเฏเฎเฎฟเฎฑเฎพเฎฉเฏ. เฎ เฎเฏเฎฉเฎฟ เฎชเฎฏเฎคเฏเฎคเฎฟเฎฉเฎฟเฎฉเฏเฎฑเฏ เฎจเฏเฎเฏเฎเฎฟ เฎชเฎฐเฎฟเฎเฏเฎคเฏเฎคเฎฎเฎเฏ เฎเฎฟเฎฑเฎพเฎฉเฏ. เฎจเฎพเฎฐเฎพเฎฏเฎฃ เฎเฎฉเฏเฎฑ เฎเฎเฏเฎเฏ เฎ เฎเฏเฎทเฎฐเฎฎเฎจเฏเฎคเฎฟเฎฐเฎคเฏเฎคเฎฟเฎฉเฎพเฎฒเฏ เฎเฎฏเฎฟเฎฐเฎฎเฏ เฎฐเฏเฎคเฏเฎฐ เฎเฎชเฎฎเฏ เฎเฏเฎฏเฏเฎค เฎชเฏเฎฃเฏเฎฏเฎฎเฎเฏเฎเฎฟเฎฑเฎพเฎฉเฏ. เฎเฎฏเฎฟเฎฐเฎฎเฏ เฎเฎพเฎฏเฎคเฏเฎฐเฏ เฎชเฎฒเฎฉเฏ, เฎเฏเฎเฎฟ เฎชเฏเฎฐเฎฃเฎต เฎเฎชเฎชเฎฒเฎฉเฏ, เฎจเฎพเฎฐเฎพเฎฏเฎฃเฎชเฎค เฎฎเฎเฏเฎเฎฟเฎฑเฎพเฎฉเฏ. เฎเฎคเฏเฎคเฎพเฎฉเฏ เฎชเฎฐเฎฎเฎชเฎค เฎฎเฎพเฎฉ เฎตเฎฟเฎทเฏเฎฃเฏ เฎชเฎคเฎฎเฏ, เฎเฎฉ เฎเฎชเฏเฎชเฏเฎดเฏเฎคเฏเฎฎเฏ เฎตเฎฟเฎคเฏเฎตเฎพเฎฉเฏเฎเฎณเฏ เฎ เฎฑเฎฟเฎฏเฎตเฏ เฎจเฎฉเฏเฎฑเฎพเฎเฎชเฏ เฎชเฎพเฎฐเฏเฎเฏเฎเฎฟเฎฑเฎพเฎฐเฏเฎเฎณเฏ. เฎฎเฎฟเฎคเฎฟเฎฒเฏเฎฏเฎฟเฎฒเฏ เฎเฎฉเฎเฎฐเฏ เฎชเฏเฎฐเฎพเฎฎเฏเฎนเฎฃเฎฐเฏเฎเฎณเฏ เฎเฎฏเฎฟเฎคเฏเฎคเฏ เฎฏเฎพเฎเฏเฎเฎฏเฎตเฎฒเฏเฎเฏเฎฏเฎฐเฏเฎฏเฏเฎฎเฏ. เฎชเฏเฎฐเฏเฎนเฎธเฏเฎชเฎคเฎฟเฎฏเฏเฎฏเฏเฎฎเฏ เฎเฏเฎเฏเฎเฏ เฎเฎคเฏเฎฏเฏ เฎเฏเฎฉเฏเฎฉเฎพเฎฐเฏ เฎเฏเฎฏเฏเฎคเฎฟเฎฐเฏเฎฒเฎฟเฎเฏเฎเฎคเฏเฎคเฏ เฎชเฏเฎฐเฏเฎต เฎฎเฎคเฏเฎคเฎฟเฎฏเฎฟเฎฒเฏ เฎเฎตเฎฉเฏ เฎจเฎฟเฎคเฏเฎฏเฎฎเฏเฎคเฏเฎฏเฎพเฎฉเฎฎเฏ เฎเฏเฎฏเฏเฎเฎฟเฎฑเฎพเฎฉเฏ? เฎ เฎตเฎฉเฏ เฎธเฎคเฎพ เฎธเฎจเฏเฎฏเฎพเฎธเฎฟ เฎเฎเฎฟเฎฑเฎพเฎฉเฏ. เฎเฎฉเฎเฏเฎเฏเฎฒเฏเฎฒเฎฟ เฎเฎชเฎจเฎฟเฎทเฎคเฏ เฎตเฎฟเฎธเฏเฎคเฎพเฎฐเฎฎเฎพเฎ เฎฎเฏเฎเฎฟเฎคเฏเฎคเฎคเฏ. 25. เฎคเฏเฎฐเฎฟเฎชเฎพเฎคเฏ เฎตเฎฟเฎชเฏเฎคเฎฟ เฎฎเฎนเฎพเฎจเฎพเฎฐเฎพเฎฏเฎฃ เฎเฎชเฎจเฎฟเฎทเฎคเฏเฎตเฎฟเฎตเฎฐเฎฃเฎฎเฏ. เฎชเฎฐเฎฎเฎคเฎคเฏเฎตเฎฎเฎฑเฎฟเฎฏ เฎชเฏเฎฐเฎฎเฏเฎนเฎพ เฎคเฏเฎตเฎฎเฎพเฎฉเฎชเฏเฎชเฎเฎฟ 1000-เฎตเฎฐเฏเฎทเฎฎเฏ เฎคเฎชเฎธเฏ เฎเฏเฎฏเฏเฎคเฎพเฎฐเฏ. เฎฎเฎนเฎพเฎตเฎฟเฎทเฏเฎฃเฏ เฎชเฏเฎฐเฎธเฎฉเฏเฎฉเฎฎเฎพเฎเฎฟ, เฎชเฏเฎฐเฎฎเฏเฎนเฎฉเฏ เฎจเฏเฎเฏเฎเฎณเฏ เฎคเฎพเฎฉเฏ

Example 2

เค เคฎเคฐเคจเคพเคฅ เคเฅ เคเคฅเคพ เคเคธ เคเคฅเคพ เคเคพ เคจเคพเคฎ เค เคฎเคฐ เคเคฅเคพ เคเคธเคฒเคฟเค เคนเฅ เคเคฟ เคเคธเคเฅ เคถเฅเคฐเคตเคฃ เคเคฐเคจเฅ เคธเฅ เคถเคฟเคต- เคเคพเคฎ เคเฅ เคชเฅเคฐเคพเคชเฅเคคเคฟ เคนเฅเคคเฅ เคนเฅเฅค เคฏเคน เคตเคน เคชเคฐเคฎ เคชเคตเคฟเคคเฅเคฐ เคเคฅเคพ เคนเฅ เคเคฟเคธเคเฅ เคธเฅเคจเคจเฅ เคธเฅ เคธเฅเคจเคจเฅ เคตเคพเคฒเฅเค เคเฅ เค เคฎเคฐเคชเคฆ เคเฅ เคชเฅเคฐเคพเคชเฅเคคเคฟ เคนเฅเคคเฅ เคนเฅเฅค เคคเคฅเคพ เคตเคน เค เคฎเคฐ เคนเฅ เคเคพเคคเฅ เคนเฅเคเฅค เคฏเคน เคเคฅเคพ เคถเฅเคฐเฅ เคถเคเคเคฐ เคญเคเคตเคพเคจ เคจเฅ เคเคธเฅ เคเฅเคซเคพ เคฎเฅเค (เคถเฅเคฐเฅ เค เคฎเคฐเคจเคพเคฅ เคเฅ เคเฅ เคเฅเคซเคพ เคฎเฅเค) เคญเคเคตเคคเฅ เคชเคพเคฐเฅเคตเคคเฅ เคเฅ เคเฅ เคธเฅเคจเคพเค เคฅเฅเฅค เคเคธ เคเคฅเคพ เคเฅ เคธเฅเคจเคเคฐ เคนเฅ เคถเฅเคฐเฅ เคถเฅเคเคฆเฅเคตเคเฅ เค เคฎเคฐ เคนเฅ เคเคฏเฅ เคฅเฅ เฅค เคเคฌ เคญเคเคตเคพเคจ เคถเฅเคฐเฅ เคถเคเคเคฐ เคฏเคน เคเคฅเคพ เคญเคเคตเคคเฅ เคชเคพเคฐเฅเคตเคคเฅ เคเฅ เคธเฅเคจเคพ เคฐเคนเฅ เคฅเฅ เคคเฅ เคตเคนเคพเค เคเค เคคเฅเคคเฅ เคเคพ เคฌเคเฅเคเคพ เคญเฅ เคเคธ เคชเคฐเคฎ เคชเคตเคฟเคคเฅเคฐ เคเคฅเคพ เคเฅ เคธเฅเคจ เคฐเคนเคพ เคฅเคพ เคเคฐ เคเคธเฅ เคธเฅเคจเคเคฐ เคซเคฟเคฐ เคเคธ เคคเฅเคคเฅ เคเฅ เคฌเคเฅเคเฅ เคจเฅ เคถเฅเคฐเฅ เคถเฅเคเคฆเฅเคต เคธเฅเคตเคฐเฅเคช เคเฅ เคชเคพเคฏเคพ เคฅเคพ เฅค 'เคถเฅเค' เคธเคเคธเฅเคเฅเคค เคฎเฅเค เคคเฅเคคเฅ เคเฅ เคเคนเคคเฅ เคนเฅเค เคเคฐ เคเคธเฅ เคเคพเคฐเคฃ เคฌเคพเคฆ เคฎเฅเค เคซเคฟเคฐ เคฎเฅเคจเคฟ 'เคถเฅเคเคฆเฅเคต, เคเฅ เคจเคพเคฎ เคธเฅ เคธเคเคธเคพเคฐ เคฎเฅเค เคชเฅเคฐเคธเคฟเคฆเฅเคง เคนเฅเคเฅค เคฏเคน เคเคฅเคพ เคญเคเคตเคคเฅ เคชเคพเคฐเฅเคตเคคเฅ เคคเคฅเคพ เคญเคเคตเคพเคจ เคถเคเคเคฐ เคเคพ เคธเคเคตเคพเคฆ เคนเฅเฅค เคฏเคน เคชเคฐเคฎ-เคชเคตเคฟเคคเฅเคฐ เคเคฅเคพ เคฒเฅเค เคต เคชเคฐเคฒเฅเค เคเคพ เคธเฅเค เคฆเฅเคจเฅ เคตเคพเคฒเฅ เคนเฅเคเฅค เคถเคเคเคฐ เคญเคเคตเคพเคจ เคเคฐ เคเคเคคเคฎเคพเคคเคพ เคเฅ เคเคธ เคธเคฎเฅเคตเคพเคฆ เคเคพ เคตเคฐเฅเคฃเคจ เคฎเฅเคเฅ เคธเคนเคฟเคคเคพ, เคจเฅเคฒเคฎเคค เคชเฅเคฐเคพเคฃ, เคคเฅเคฐเฅเคฅ เคธเคเคเฅเคฐเคน เคเคฆเคฟ เคเฅเคฐเคจเฅเคฅเฅเค เคฎเฅเค เคชเคพเคฏเคพ เคเคพเคคเคพ เคนเฅเฅค เคนเคฎ เคฏเคนเคพเค เคชเคฐ เคเคชเคเฅ เคธเคฎเฅเคฎเฅเค เคฏเคน เคชเคฐเคฎ เคชเคตเคฟเคคเฅเคฐ เคเคฅเคพ เคตเคฟเคธเฅเคคเคพเคฐ เคชเฅเคฐเฅเคตเค เคฐเคเฅเคเคเฅ เฅค เคฆเฅเคต เคเคทเคฟ เคจเคพเคฐเคฆ เคเคพ เคเฅเคฒเคพเคถ เคชเคฐเฅเคตเคค เคชเคฐ เคเคจเคพ เคเคฐ เคถเฅเคฐเฅ เคชเคพเคฐเฅเคตเคคเฅเคเฅ เคธเฅ เคชเฅเคเคจเคพ เคเคฟ เคญเคเคตเคพเคจ เคถเคเคเคฐ เคเฅ เคเคฒเฅ เคฎเฅเค เคฐเฅเคฃเฅเคกเคฎเคพเคฒเคพ เคเฅเคฏเฅเค เคนเฅ? เคเค เคฌเคพเคฐ เคฆเฅเคต เคเคทเคฟ เคจเคพเคฐเคฆ เคเฅเคฒเคพเคถ เคชเคฐเฅเคตเคค เคชเคฐ เคญเคเคตเคพเคจ เคถเฅเคฐเฅ เคถเคเคเคฐ เคเฅ เคธเฅเคฅเคพเคจ เคชเคฐ เคฆเคฐเฅเคถเคจเคพเคฐเฅเคฅ เคชเคงเคพเคฐเฅ เฅค เคญเคเคตเคพเคจ เคถเฅเคฐเฅ เคถเคเคเคฐ เคเคธ เคธเคฎเคฏ เคตเคจ, เคตเคฟเคนเคพเคฐ เคเฅ เคฒเคฟเค เคเคฏเฅ เคนเฅเค เคฅเฅ เคเคฐ เคญเคเคตเคคเฅ เคชเคพเคฐเฅเคตเคคเฅ เคฏเคนเคพเค เคชเคฐ เคตเคฟเคฐเคพเคเคฎเคพเคจ เคฅเฅเคเฅค เคถเฅเคฐเฅ เคชเคพเคฐเฅเคตเคคเฅเคเฅ เคจเฅ เคฆเฅเคต เคเคทเคฟ เคจเคพเคฐเคฆ เคเฅ เคชเฅเคฐเคฃเคพเคฎ เคเคฟเคฏเคพ เคเคฐ เคธเคพเคฆเคฐ เคเคธเคจ เคฆเคฟเคฏเคพเฅค เคเคฐ เคฌเฅเคฒเฅเค- 'เคฆเฅเคต เคเคทเคฟ! เคเคชเคจเฅ เคฏเคนเคพเค เคชเคงเคพเคฐ เคเคฐ เคนเคฎ เคชเคฐ เคฌเคกเคผเฅ เคเฅเคชเคพ เคเฅ เค เคชเคจเฅ เคเคจเฅ เคเคพ เคเคพเคฐเคฃ เคเคนเคฟเค เฅค' เคฆเฅเคต เคเคทเคฟ เคจเคพเคฐเคฆ เคฌเฅเคฒเคพ-"เคฆเฅเคตเฅ! เคฎเฅเคฐเคพ เคเค เคชเฅเคฐเคถเฅเคจ เคนเฅ เคเคธเคเคพ เคเคคเฅเคคเคฐ เคเคพเคนเคคเคพ เคนเฅเคเฅค" เคจเฅ เคเคนเคพ-โเคเคนเคฟเค?" เคถเฅเคฐเฅ เคชเคพเคฐเฅเคตเคคเฅเคเฅ เคจเฅ เคเคนเคพ-"เคเคนเคฟเค?" เคจเคพเคฐเคฆ เคฌเฅเคฒเฅ-"เคฆเฅเคตเฅ! เคฎเฅเคเฅ เคเคธ เคฌเคพเคค เคเคพ เคฌเคกเคผเคพ เคเคถเฅเคเคฐเฅเคฏ เคนเฅ เคญเคเคตเคพเคจ เคถเฅเคฐเฅ เคถเคเคเคฐ เคเฅเคเคฟ เคนเคฎ เคฆเฅเคจเฅเค เคธเฅ เคฌเคกเคผเฅ เคนเฅเคเฅค เคเคจเคเฅ เคเคฒเฅ เคฎเฅเค เคฐเฅเคฃเฅเคก เคฎเคพเคฒเคพ เคเฅเคฏเฅเค เคนเฅ?

Example 3
2. Complex table parsing

6 Public Health Nursing TABLE 2. Study Findings
| Characteristics | Experimental 1 (n = 50) | Control 1 (n = 50) | Experimental 2 (n = 50) | Control 2 (n = 38) | ||||
|---|---|---|---|---|---|---|---|---|
| Antenatal and childbirth care | ||||||||
| Any antenatal care | 33 | 49 | <.001 | 47 | 18 | <.001 | ||
| Received tetanus immunization โฅ2 times during last pregnancyแต | 33 | 50 | .001 | 47 | 29 | .379 | ||
| Skilled attendant at last birth | 20 | 45 | <.001 | 8 | 12 | .084 | ||
| Knowledge of danger signs during the perinatal period | ||||||||
| Number of danger signs recalled, 27 items (SD) | 7.90 (3.07) | 4.70 (1.88) | <.001 | 13.92 (3.88) | 4.37 (2.62) | <.001 | ||
| Contraception | ||||||||
| Number of modern methodsแต recalled (SD) | 4.06 (1.37) | 2.82 (1.08) | <.001 | 5.16 (1.00) | 2.00 (0.77) | <.001 | ||
| First aidแถ Acceptable treatment answeredแต | 45 | 7 | <.001 | 33 | 5 | <.001 | ||
| Health behaviors | ||||||||
| Care for sick <5-year-old child | ||||||||
| Has your child had a fever during the last 2 weeks? | 5 | 17 | .004 | 4 | 9 | .066 | ||
| Did you seek advice or treatment for the illness outside of your home? | 1 | 13 | .039 | 0 | 9 | .001 | ||
| Has your child had a cough or difficulty breathing during the last 2 weeks? | 11 | 20 | .052 | 4 | 9 | .066 | ||
| Did you seek advice or treatment for the illness outside of your home? | 3 | 2 | 1.000 | 1 | 3 | .400 | ||
| Sanitation | ||||||||
| What was done to dispose of the stool? Appropriate methodแต | 26 | 22 | .106 | 21 | 4 | .002 | ||
| Inappropriate methodแถ | 3 | 9 | 13 | 17 | ||||
| Number of correct precautions against malaria recalled (eight items) Mean (SD) | 2.64 (0.985) | 1.28 (0.784) | <.001 | 2.72 (1.011) | 0.58 (0.522) | <.001 |

Example 4

118 Egypt. J. Phytopathol., Vo. 50, No. 2, pp 104-123 Table (10): The effect of different control treatments on some growth parameters of two Tagetes varieties grown in infested soil 90 days after transplanting, under greenhouse conditions.
| Tagetes spp. | Treatments | F. oxysporum | F. solani | R. solani | ||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Plant height (cm) | Fresh weight (g) | Dry weight (g) | Plant height (cm) | Fresh weight (g) | Dry weight (g) | Plant height (cm) | Fresh weight (g) | Dry weight (g) | ||
| Tagetes minuta | Bio-Cure B | 60 | 400 | 130.3 | 55 | 380 | 125.6 | 50 | 360 | 115.8 |
| Bio-Cure F | 70 | 460 | 151.2 | 66 | 450 | 149.4 | 60 | 455 | 153.6 | |
| Rhizo-N | 76 | 500 | 163.4 | 73 | 470 | 155.5 | 70 | 460 | 156.6 | |
| Topsin-M 70 | 82 | 550 | 182.7 | 80 | 540 | 179.9 | 77 | 530 | 175.7 | |
| Vitavax 200 | 90 | 600 | 199.5 | 86 | 590 | 190.5 | 80 | 580 | 190.8 | |
| Wood vinegar | 80 | 520 | 172.9 | 75 | 511 | 171.5 | 70 | 500 | 167.8 | |
| Control | 30 | 200 | 65.8 | 33 | 210 | 70.6 | 35 | 220 | 70.6 | |
| Mean | 69.7 | 461.4 | 152.2 | 66.5 | 450.1 | 149 | 63.1 | 443.6 | 147.3 | |
| Tagetes erecta | Bio-Cure B | 65 | 430 | 135.7 | 59 | 395 | 130.7 | 54 | 366 | 122 |
| Bio-Cure F | 73 | 470 | 155.8 | 71 | 460 | 155.5 | 63 | 462 | 164.7 | |
| Rhizo-N | 80 | 520 | 166.7 | 75 | 485 | 166.4 | 75 | 473 | 173 | |
| Topsin-M 70 | 85 | 565 | 185.5 | 83 | 455 | 185.4 | 81 | 540 | 183 | |
| Vitavax 200 | 94 | 610 | 210 | 91 | 610 | 196.2 | 86 | 595 | 196.6 | |
| Wood vinegar | 83 | 532 | 178.6 | 82 | 520 | 175.6 | 75 | 509 | 177 | |
| Control | 31 | 205 | 65.0 | 32 | 200 | 71 | 34 | 210 | 71.4 | |
| Mean | 73 | 476 | 156.7 | 70.4 | 446.4 | 154.4 | 66.8 | 450.7 | 155.4 | |
| L.S.D. at 5% Treatments (T) = 2.30, Varieties (V) = 0.50, Fungi (F) = 3.30, TรV = 4.40, TรF = 5.60, VรF = 5.20, TรVรF = 6.40 |

Example 5
3. Multilingual visual reasoning
Visual components in a document play an important role. Oftentimes charts and illustrations communicate details that are not present in the extracted text. Sarvam Vision delivers natively multilingual reasoning capabilities for such visual elements in a document.

| Metric | Decoding Temperature (Std Dev) | Suffix Injection (Std Dev) | Prompt Paraphrase (Std Dev) | | :--- | :--- | :--- | :--- | | Refusal Rate | ~0.195 | ~0.312 | ~0.134 | | Toxicity | ~0.110 | ~0.210 | ~0.092 | | AQI | ~0.020 | ~0.060 | ~0.020 | Figure 6: Standard Deviation of Metrics under Perturbations. AQI exhibits consistently lower variance than Refusal Rate (RR) and Detoxify-based Toxicity across decoding temperature, suffix injection, and prompt drift. This reflects its geometric robustness to generation stochasticity and surface perturbations, making it more stable for adversarial alignment evaluation.
| Model | AQI (Clean) | AQI (Jailbreak) | Drop (%) |
|---|---|---|---|
| TinyLLaMA | 0.91 | 0.34 | 62.6% |
| Phi-2 | 0.91 | 0.35 | 61.5% |
| GPT-NeoX | 0.91 | 0.61 | 32.9% |
| LLaMA-13B | 0.91 | 0.67 | 26.4% |
| LLaMA-65B | 0.91 | 0.73 | 19.8% |
| Model | AQI (Orig) | AQI (Paraphrase) | Drop (%) |
|---|---|---|---|
| TinyLLaMA | 0.58 | 0.32 | 44.8 |
| Phi-2 | 0.65 | 0.45 | 30.8 |
| LLaMA-13B | 0.78 | 0.70 | 10.3 |
| LLaMA-65B | 0.81 | 0.76 | 6.1 |

Example 6

เคเคฟเคคเฅเคฐ เคถเฅเคฐเฅเคทเค: เคชเฅเคฐเคพเคเฅเคจ เคญเคพเคฐเคค เคตเคฟเคตเคฐเคฃ: เคฏเคน เคเคฟเคคเฅเคฐ เคญเคพเคฐเคค เคเคพ เคเค เคตเคฟเคธเฅเคคเฅเคค เคเคคเคฟเคนเคพเคธเคฟเค เคฎเคพเคจเคเคฟเคคเฅเคฐ เคนเฅเฅค เคเคธเคฎเฅเค เคตเคฟเคญเคฟเคจเฅเคจ เคจเคฆเคฟเคฏเฅเค, เคชเคฐเฅเคตเคค เคถเฅเคฐเฅเคเคเคฒเคพเคเค เคเคฐ เคญเฅเคเฅเคฒเคฟเค เคเฅเคทเฅเคคเฅเคฐเฅเค เคเฅ เคฆเคฐเฅเคถเคพเคฏเคพ เคเคฏเคพ เคนเฅเฅค เคฎเคพเคจเคเคฟเคคเฅเคฐ เคชเคฐ เคเค เคธเฅเคฅเคพเคจเฅเค เคเฅ เคจเคพเคฎ เคฒเคฟเคเฅ เคนเฅเค เคเฅ เคธเคเคญเคตเคคเค เคชเฅเคฐเคพเคเฅเคจ เคญเคพเคฐเคคเฅเคฏ เคฐเคพเคเฅเคฏเฅเค เคฏเคพ เคถเคนเคฐเฅเค เคเฅ เคเคเคเคฟเคค เคเคฐเคคเฅ เคนเฅเคเฅค เคจเฅเคเฅ เคฆเคพเคเค เคเคฐ 'เค เคเคเฅเคฐเฅเคเฅ เคฎเคฟเคฒ' (English Mill) เคฒเคฟเคเคพ เคนเฅเค เคธเฅเคเฅเคฒ เคฌเคพเคฐ เคนเฅเฅค

Example 7
4. Visual data, structured outputs

เค เคชเฅเคเฅเคทเคฟเคค เคชเคพเค เฅเคฏเคเฅเคฐเคฎ เคธเฅเคงเคพเคฐ เคเคฐเคจเฅ เค เคฅเคตเคพ เคจเฅเคคเคฟเคเคค เคเคพเคฐเฅเคฏเคเฅเคฐเคฎเฅเค เคเคพ เคเค เคฎเคเค เคเคชเคฒเคฌเฅเคง เคเคฐเคพเคเคฐ เคถเคฟเคเฅเคทเคพ เคจเฅเคคเคฟ เคนเฅเคคเฅ 'เคชเคฐเคฟเคฃเคพเคฎเฅเค' เคชเคฐ เคงเฅเคฏเคพเคจ เคเฅเคเคฆเฅเคฐเคฟเคค เคเคฐเคจเคพ เคนเฅเฅค เคชเฅเคฐเคคเคฟเคธเฅเคชเคฐเฅเคงเฅ เคเคฐ เคธเคนเคฏเฅเคเฅ เคธเคเคเคตเคพเคฆ เคเฅ เคญเคพเคตเคจเคพ เคเฅ เคฌเคขเคผเคพเคตเคพ เคฆเฅเคจเฅ เคเฅ เคฒเคฟเค เคจเฅเคคเคฟ เคเคฏเฅเค เคเฅ เค เคงเคฟเคฆเฅเคถ เคเฅ เค เคจเฅเคฐเฅเคช, เคเคธเคเคเฅเคฏเฅเคเค เคฆเฅเคถ เคญเคฐ เคฎเฅเค เคเฅเคเคพเคจ เคเคฐ เคธเคฐเฅเคตเฅเคคเฅเคคเคฎ เคชเฅเคฐเคฅเคพเคเค เคเฅ เคธเคพเคเคพ เคเคฐเคจเฅ เคเฅ เคธเฅเคตเคฟเคงเคพ เคชเฅเคฐเคฆเคพเคจ เคเคฐเคจเฅ เคเคพ เคชเฅเคฐเคฏเคพเคธ เคเคฐเคคเคพ เคนเฅเฅค เคฎเคพเคจเคต เคธเคเคธเคพเคงเคจ เคตเคฟเคเคพเคธ เคฎเคเคคเฅเคฐเคพเคฒเคฏ (เคเคฎเคเคเคเคฐเคกเฅ), เคตเคฟเคถเฅเคต เคฌเฅเคเค เคเคฐ เคเฅเคทเฅเคคเฅเคฐ เคตเคฟเคถเฅเคทเคเฅเคเฅเค เคเฅเคธเฅ เคชเฅเคฐเคฎเฅเค เคนเคฟเคคเคงเคพเคฐเคเฅเค เคธเคนเคฟเคค เคเค เคธเคนเคฏเฅเคเฅ เคชเฅเคฐเคเฅเคฐเคฟเคฏเคพ เคเฅ เคฎเคพเคงเฅเคฏเคฎ เคธเฅ เคตเคฟเคเคธเคฟเคค เคธเฅเคเคเคพเคเค เคฎเฅเค 30 เคฎเคนเคคเฅเคตเคชเฅเคฐเฅเคฃ เคธเคเคเฅเคคเค เคถเคพเคฎเคฟเคฒ เคนเฅเคเฅค เคฏเฅ เคธเคเคเฅเคคเค เคนเฅเค: เคถเฅเคฐเฅเคฃเฅ 1: เคชเคฐเคฟเคฃเคพเคฎ เคกเฅเคฎเฅเคจ 1: เคถเคฟเคเฅเคทเคฃ เคชเคฐเคฟเคฃเคพเคฎ เคกเฅเคฎเฅเคจ 2: เคชเคนเฅเคเค เคชเคฐเคฟเคฃเคพเคฎ เคกเฅเคฎเฅเคจ 3: เคชเคฐเคฟเคฃเคพเคฎเฅเค เคเฅ เคฒเคฟเค เค เคตเคธเคเคฐเคเคจเคพ เคเคฐ เคธเฅเคตเคฟเคงเคพเคเค เคกเฅเคฎเฅเคจ 4: เคเคเฅเคตเคฟเคเฅ เคชเคฐเคฟเคฃเคพเคฎ เคถเฅเคฐเฅเคฃเฅ 2: เคถเคพเคธเฅ-เคชเฅเคฐเคเฅเคฐเคฟเคฏเคพ-เคธเคนเคพเคฏเคคเคพ เคชเคฐเคฟเคฃเคพเคฎ โช เคถเคฟเคเฅเคทเคฃ เคธเคเคฌเคเคงเฅ เคชเคฐเคฟเคฃเคพเคฎ โช เค เคญเคฟเคเคฎ เคชเคฐเคฟเคฃเคพเคฎ โช เคชเคฐเคฟเคฃเคพเคฎเฅเค เคเฅ เคฒเคฟเค เค เคตเคธเคเคฐเคเคจเคพ เคเคฐ เคธเฅเคตเคฟเคงเคพเคเค โช เคเคเฅเคตเคฟเคเฅ เคชเคฐเคฟเคฃเคพเคฎ โช เคถเคพเคธเคจ เคชเฅเคฐเคเฅเคฐเคฟเคฏเคพ เคธเคนเคพเคฏเคคเคพ เคชเคฐเคฟเคฃเคพเคฎ เคฏเคน เคเคตเคฟ เคเค เคชเคพเค เคเคพเคฐเฅเค เคนเฅ เคเฅ เคชเคพเคเค เค เคฒเค-เค เคฒเค เคถเฅเคฐเฅเคฃเคฟเคฏเฅเค เคฎเฅเค เคชเฅเคฐเคคเคฟเคถเคค เคตเคฟเคคเคฐเคฃ เคเฅ เคชเฅเคฐเคฆเคฐเฅเคถเคฟเคค เคเคฐเคคเฅ เคนเฅ, เคเฅ เคธเคเคญเคตเคคเค เคเคฟเคธเฅ เคฐเคฟเคชเฅเคฐเฅเค เคฏเคพ เค เคงเฅเคฏเคฏเคจ เคเฅ เคจเคฟเคทเฅเคเคฐเฅเคทเฅเค เคธเฅ เคธเคเคฌเคเคงเคฟเคค เคนเฅเฅค เคฆเคพเคเค เคเคฐ เคเฅ เคฒเฅเคเฅเคเคก (legend) เคฐเคเคเฅเค เคเคฐ เคเคจเคเฅ เคธเคเคฌเคเคงเคฟเคค เคฒเฅเคฌเคฒ เคฆเฅเคตเคพเคฐเคพ เคกเฅเคเคพ เคฌเคฟเคเคฆเฅเคเค เคเฅ เคชเคนเคเคพเคจ เคเคฐเคพเคคเฅ เคนเฅ: 'เคฒเคฐเฅเคจเคฟเคเค เคเคเคเคเคฎเฅเคธ' (Learning Outcomes) เคเฅ เคฒเคฟเค เคเฅเคฒเคพเคฌเฅ, 'เคเคเฅเคธเฅเคธ เคเคเคเคเคฎเฅเคธ' (Access Outcomes) เคเฅ เคฒเคฟเค เคจเคพเคฐเคเคเฅ, 'เคเคจเฅเคซเฅเคฐเคพเคธเฅเคเฅเคฐเคเฅเคเคฐ เคเคเคก เคซเฅเคธเคฟเคฒเคฟเคเฅเค เคซเฅเคฐ เคเคเคเคเคฎเฅเคธ' (Infrastructure & Facilities for Outcomes) เคเฅ เคฒเคฟเค เคชเฅเคฒเคพ, 'เคเคเฅเคตเคฟเคเฅ เคเคเคเคเคฎเฅเคธ' (Equity Outcomes) เคเฅ เคฒเคฟเค เคนเคฐเคพ, เคเคฐ 'เคเคตเคฐเฅเคจเฅเคเคธ เคชเฅเคฐเฅเคธเฅเคธเฅเคธ เคเคกเคฟเคเค เคเคเคเคเคฎเฅเคธ' (Governance Processes Aiding Outcomes) เคเฅ เคฒเคฟเค เคจเฅเคฒเคพเฅค เคกเฅเคเคพ เคเคพ เคตเคฟเคธเฅเคคเฅเคค เคตเคฟเคตเคฐเคฃ เคเคธ เคชเฅเคฐเคเคพเคฐ เคนเฅ: 1. เคฒเคฐเฅเคจเคฟเคเค เคเคเคเคเคฎเฅเคธ (Learning Outcomes): เคฏเคน เคถเฅเคฐเฅเคฃเฅ เคธเคฌเคธเฅ เคฌเคกเคผเคพ เคนเคฟเคธเฅเคธเคพ เคฐเคเคคเฅ เคนเฅ, เคเฅ เคเฅเคฒ เคนเคฟเคธเฅเคธเฅเคฆเคพเคฐเฅ เคเคพ 34% เคนเฅเฅค 2. เคเคเฅเคตเคฟเคเฅ เคเคเคเคเคฎเฅเคธ (Equity Outcomes): เคฆเฅเคธเคฐเคพ เคธเคฌเคธเฅ เคฌเคกเคผเคพ เคเคเคก เคนเคฐเฅ เคฐเคเค เคฎเฅเค เคฆเคฐเฅเคถเคพเคฏเคพ เคเคฏเคพ เคนเฅ, เคเฅ 28% เคนเฅเฅค 3. เคเคตเคฐเฅเคจเฅเคเคธ เคชเฅเคฐเฅเคธเฅเคธเฅเคธ เคเคกเคฟเคเค เคเคเคเคเคฎเฅเคธ (Governance Processes Aiding Outcomes): เคจเฅเคฒเฅ เคฐเคเค เคฎเฅเค เคฆเคฟเคเคพเคฏเคพ เคเคฏเคพ, เคฏเคน เคเคเคก 26% เคนเฅเฅค 4. เคเคเฅเคธเฅเคธ เคเคเคเคเคฎเฅเคธ (Access Outcomes): เคจเคพเคฐเคเคเฅ เคฐเคเค เคฎเฅเค เคเคฟเคคเฅเคฐเคฟเคค, เคฏเคน เคญเคพเค 9% เคนเฅเฅค 5. เคเคจเฅเคซเฅเคฐเคพเคธเฅเคเฅเคฐเคเฅเคเคฐ เคเคเคก เคซเฅเคธเคฟเคฒเคฟเคเฅเค เคซเฅเคฐ เคเคเคเคเคฎเฅเคธ (Infrastructure & Facilities for Outcomes): เคชเฅเคฒเฅ เคฐเคเค เคฎเฅเค เคฆเคฟเคเคพเค เคฆเฅเคจเฅ เคตเคพเคฒเคพ, เคฏเคน เคธเคฌเคธเฅ เคเฅเคเคพ เคธเฅเคฒเคพเคเคธ เคเฅเคตเคฒ 3% เคนเฅเฅค เคเฅเคฒ เคฎเคฟเคฒเคพเคเคฐ, เคถเฅเคฐเฅเคท เคคเฅเคจ เคถเฅเคฐเฅเคฃเคฟเคฏเคพเค ('เคฒเคฐเฅเคจเคฟเคเค', 'เคเคเฅเคตเคฟเคเฅ', เคเคฐ 'เคเคตเคฐเฅเคจเฅเคเคธ') เคธเคพเคฎเฅเคนเคฟเค เคฐเฅเคช เคธเฅ เคชเฅเคฐเฅ เคตเฅเคคเฅเคค เคเฅ เคฒเคเคญเค 88% เคนเฅเค, เคเคฌเคเคฟ เคถเฅเคท เคฆเฅ เคถเฅเคฐเฅเคฃเคฟเคฏเคพเค เคฎเคฟเคฒเคเคฐ เคถเฅเคท 12% เคฌเคจเคพเคคเฅ เคนเฅเคเฅค เคธเฅเคเฅเคฒเฅ เคถเคฟเคเฅเคทเคพ เคเฅ เคชเคฐเคฟเคฃเคพเคฎ เคตเคพเคธเฅเคคเคตเคฟเค เคถเคฟเคเฅเคทเคฃ เคชเคฐเคฟเคฃเคพเคฎเฅเค เคฎเฅเค เคนเฅเคจเฅ เคเคพเคนเคฟเคเฅค เคฏเคน เคชเฅเคฐเคฃเคพเคฒเฅ เคถเคฟเคเฅเคทเคฃ เคธเฅเคเคจเฅ เคเฅ เคเคฐ เค เคเฅเคฐเคธเคฐ เคนเฅ เคฏเคน เคธเฅเคจเคฟเคถเฅเคเคฟเคค เคเคฐเคจเฅ เคเฅ เคฒเคฟเค เคเคธเคเคเฅเคฏเฅเคเค เคถเคฟเคเฅเคทเคฃ เคชเคฐเคฟเคฃเคพเคฎเฅเค เคเฅ เคฒเคฟเค เคฒเคเคญเค เค เคชเคจเคพ เคเคงเคพ เคฏเฅเคเคฆเคพเคจ เคฆเฅเคคเคพ เคนเฅเฅค เคถเคฟเคเฅเคทเคฃ เคชเคฐ เคงเฅเคฏเคพเคจ เคเฅเคเคฆเฅเคฐเคฟเคค เคฐเคนเฅ เคฏเคน เคธเฅเคจเคฟเคถเฅเคเคฟเคค เคเคฐเคจเฅ เคเฅ เคฒเคฟเค เคฏเคน เคธเคฎเฅเคเฅ เคฐเคพเคทเฅเคเฅเคฐ เคฎเฅเค เคเค เคฎเคเคฌเฅเคค เคธเคเคเฅเคค เคญเฅเคเคคเคพ เคนเฅเฅค เคคเฅเคฒเคจเคพเคคเฅเคฎเค เคธเฅเคตเคฟเคงเคพ เคชเฅเคฐเคฆเคพเคจ เคเคฐเคจเฅ เคเฅ เคฒเคฟเค, เคฐเคพเคเฅเคฏเฅเค เคเคฐ เคธเคเค เคฐเคพเคเฅเคฏ เคเฅเคทเฅเคคเฅเคฐเฅเค เคเฅ เคฌเคกเคผเฅ เคฐเคพเคเฅเคฏเฅเค, เคเฅเคเฅ เคฐเคพเคเฅเคฏเฅเค เคเคฐ เคธเคเค เคฐเคพเคเฅเคฏ เคเฅเคทเฅเคคเฅเคฐเฅเค เคเฅ เคฐเฅเคช เคฎเฅเค เคตเคฐเฅเคเฅเคเฅเคค เคเคฟเคฏเคพ เคเคฏเคพ เคนเฅเฅค เคเคจ เคธเคฎเฅเคนเฅเค เคฎเฅเค เคธเคฎเคเฅเคฐ เคจเคฟเคทเฅเคชเคพเคฆเคจ เคธเฅเคเฅเคฐ 45

Example 8
In-the-Wild OCR and Perception
Sarvam Vision is built on a foundation of general image understanding and multilingual capabilities. While our current efforts are focused on pushing the frontiers of document intelligence, these broader capabilities remain a core part of the model.
Some illustrations of how Sarvam Vision interprets the natural image contexts:

English Caption
output
The image captures a wide, paved asphalt road stretching into the distance under a bright, clear sky. On the left side of the road, there is a sidewalk lined with a series of blue and white metal bike racks. Behind these racks, a low fence with a green base and yellow horizontal bars separates the sidewalk from a dense, lush green tree line. The trees are thick with foliage, creating a natural canopy over the road. In the middle distance, a blue public trash bin is visible near the fence. Further down the road, several motorcyclists are riding away from the viewpoint, and a white car is also visible in the distance. The road surface is marked with white dashed lines. The overall scene is bright and sunny, suggesting a clear day.

Kannada Caption
output
เฒ เฒเฒฟเฒคเณเฒฐเฒตเณ เฒเฒเฒฆเณ เฒตเฒฟเฒถเฒพเฒฒเฒตเฒพเฒฆ เฒกเฒพเฒเฒฌเฒฐเณ เฒฐเฒธเณเฒคเณเฒฏเฒจเณเฒจเณ เฒคเณเฒฐเฒฟเฒธเณเฒคเณเฒคเฒฆเณ, เฒเฒฆเณ เฒฌเฒนเณเฒถเฒ เฒเฒเฒฆเณ เฒนเณเฒฆเณเฒฆเฒพเฒฐเฒฟเฒฏเฒพเฒเฒฟเฒฐเฒฌเฒนเณเฒฆเณ. เฒฐเฒธเณเฒคเณเฒฏ เฒเฒกเฒญเฒพเฒเฒฆเฒฒเณเฒฒเฒฟ เฒฆเฒเณเฒเฒตเฒพเฒฆ เฒนเฒธเฒฟเฒฐเณ เฒฎเฒฐเฒเฒณ เฒธเฒพเฒฒเณ เฒเฒฆเณ, เฒเฒฆเณ เฒฐเฒธเณเฒคเณเฒฏ เฒฎเณเฒฒเณ เฒจเณเฒธเฒฐเณเฒเฒฟเฒ เฒฎเณเฒฒเณเฒเฒพเฒตเฒฃเฒฟเฒฏเฒจเณเฒจเณ เฒธเณเฒทเณเฒเฒฟเฒธเณเฒคเณเฒคเฒฆเณ. เฒฎเฒฐเฒเฒณ เฒชเฒเณเฒเฒฆเฒฒเณเฒฒเฒฟ เฒคเฒฟเฒณเฒฟ เฒจเณเฒฒเฒฟ เฒฌเฒฃเณเฒฃเฒฆ เฒฒเณเฒนเฒฆ เฒฌเณเฒฒเฒฟ เฒฎเฒคเณเฒคเณ เฒเฒเฒฆเณ เฒธเฒฃเณเฒฃ เฒจเณเฒฒเฒฟ เฒฌเฒฃเณเฒฃเฒฆ เฒเฒธเฒฆ เฒฌเณเฒเณเฒเฒฟ เฒเฒฆเณ. เฒฐเฒธเณเฒคเณเฒฏ เฒฌเฒฒเฒฌเฒฆเฒฟเฒฏเฒฒเณเฒฒเฒฟ, เฒฆเณเฒฐเฒฆเฒฒเณเฒฒเฒฟ เฒเณเฒฒเฒตเณ เฒเฒจเฒฐเณ เฒฎเณเฒเฒพเฒฐเณ เฒธเณเฒเฒฒเณเฒเฒณเฒฒเณเฒฒเฒฟ เฒชเณเฒฐเฒฏเฒพเฒฃเฒฟเฒธเณเฒคเณเฒคเฒฟเฒฐเณเฒตเณเฒฆเฒจเณเฒจเณ เฒเฒพเฒฃเฒฌเฒนเณเฒฆเณ. เฒฐเฒธเณเฒคเณเฒฏ เฒฎเณเฒฒเณ เฒฌเฒฟเฒณเฒฟ เฒฌเฒฃเณเฒฃเฒฆ เฒเณเฒฐเณเฒเฒณเฒจเณเฒจเณ เฒเณเฒฐเณเฒคเฒฟเฒธเฒฒเฒพเฒเฒฟเฒฆเณ. เฒเฒเฒพเฒถเฒตเณ เฒชเณเฒฐเฒเฒพเฒถเฒฎเฒพเฒจเฒตเฒพเฒเฒฟเฒฆเณเฒฆเณ, เฒเฒฆเณ เฒฌเฒฟเฒธเฒฟเฒฒเฒฟเฒจ เฒฆเฒฟเฒจเฒตเฒจเณเฒจเณ เฒธเณเฒเฒฟเฒธเณเฒคเณเฒคเฒฆเณ.

OCR in the wild
output
เชเชพเชนเซเชฐ เชจเซเชเซเชธ เชเชฅเซ เช เชเชพเชนเซเชฐ เชจเซเชเซเชธ เชฅเซ เชเชพเชฃ เชเชฐเชตเชพ เชฎเชพเช เชเชตเซ เชเซ เชเซ เชธเชฆเชฐเชนเซ เชเชกเชพ เชงเซเชตเชพเชฐเชพ เชซเชพเชณเชตเชตเชพเชฎเชพเช เชเชตเซเชฒ เชชเซเชฒเซเช เชเชชเชฐ เชเซเชเช เชเชจ เชเชเชฐเซ (เชธเซเชฒเซเชก เชตเซเชธเซเช) เชจเชพเชเชตเซ เชจเชนเซ เชธเชฆเชฐเชนเซ เชเชเซเชฏเชพ เชเชชเชฐ เชเชเชฐเซ เชจเชพเชเชจเชพเชฐ เชธเชพเชฎเซ เชเชพเชฎ เชชเชเชเชพเชฏเชค เช เชธเชฒเชพเชฒเซ เชงเซเชตเชพเชฐเชพ เชเชพเชฏเชฆเซเชธเชฐ เชจเซ เชเชพเชฐเซเชฏเชตเชพเชนเซ เชนเชพเชฅ เชงเชฐเชตเชพเชฎเชพเช เชเชตเชถเซ เชเซเชจเซ เชจเซเชเชง เชฒเซเชถเซ. เชธเชฐเชชเชเช เชถเซเชฐเซ เช เชธเชฒเชพเชฒเซ เชเซเชฐเชพเชฎ เชชเชเชเชพเชฏเชค

Structured information extraction in the wild
output
| STA | ETA | Airline | Flt No | Origin | Status | | :---: | :---: | :--- | :--- | :--- | :--- | | 02:00 | 01:29 | IndiGo | 6E 6256 | เฒเณเฒฒเณเฒเฒคเฒพ | เฒเฒเฒฎเฒฟเฒธเฒฟเฒฆเณ | | 02:00 | 01:56 | IndiGo | 6E 5284 | เฒฎเณเฒเฒฌเฒฏเฒฟ | เฒเฒเฒฎเฒฟเฒธเฒฟเฒฆเณ | | 02:05 | 02:01 | IndiGo | 6E 996 | เฒ เฒนเฒฎเฒฆเฒพเฒฌเฒพเฒฆเณ | เฒเฒเฒฎเฒฟเฒธเฒฟเฒฆเณ | | 02:10 | 02:10 | IndiGo | 6E 1723 | เฒฆเณเฒนเฒพ | เฒธเฒฐเฒฟเฒฏเฒพเฒฆ เฒธเฒฎเฒฏ | | 02:20 | 02:00 | QATAR | QR 572 | เฒฆเณเฒนเฒพ | เฒฌเณเฒ เฒเฒเฒฎเฒฟเฒธเณเฒคเณเฒคเฒฟเฒฆเณ | | 02:20 | 02:10 | IndiGo | 6E 361 | เฒชเณเฒฃเณ | เฒธเฒฐเฒฟเฒฏเฒพเฒฆ เฒธเฒฎเฒฏ | | 02:30 | 02:35 | Emirates | EK 568 | เฒฆเณเฒฌเณ | เฒธเฒฐเฒฟเฒฏเฒพเฒฆ เฒธเฒฎเฒฏ | | 02:50 | 02:50 | AirArabia | G9 496 | เฒถเฒพเฒฐเณเฒเฒพ | เฒธเฒฐเฒฟเฒฏเฒพเฒฆ เฒธเฒฎเฒฏ | | 03:05 | 03:05 | ETIHAD | EY 216 | เฒ เฒฌเณเฒงเฒพเฒฌเฒฟ | เฒธเฒฐเฒฟเฒฏเฒพเฒฆ เฒธเฒฎเฒฏ | | 03:05 | 02:41 | IndiGo | 6E 2403 | เฒฆเณเฒนเฒฒเฒฟ | เฒฌเณเฒ เฒเฒเฒฎเฒฟเฒธเณเฒคเณเฒคเฒฟเฒฆเณ |

Student Handwriting Recognition
output
APJ Abdul Kalam was a great scientist and leader from India. He loved science and worked hard to make rockets and missiles. He was also known as "Missile Man". He became India's President in 2002 and was affectionately called the "People's President". Kalam played a pivotal role at the Defence Research and Development Organization (DRDO) and ISRO. He was the brain behind India's indigenous missile development, leading projects like Agni and Prithvi.
Edge Cases
While the performance of the models are significantly better than other models for Indian languages; it is not perfect. We did find edge cases - a few of them are shared here. Incorrect translation of the Bengali script while describing the image.

Incorrect translation of the bengali script while describing the image.
output
The image shows the storefront of a shop named "Doyamondilibrerii," which translates to "Doyamond Library." The shop is located in Kolkata, as indicated by the address "368, Rabindra Sarani, Kolkata-6" on the signboard. The signboard is black with white Bengali script. Above the shop, there is a balcony with a red metal railing and green shutters. The building's facade is painted pink, and there are decorative carvings on the left side. A black electrical wire runs across the front of the building. The shop appears to be a local bookstore or library.

A low resource Indic Language
output
The image depicts a busy street scene in an urban area. There are two auto-rickshaws, one black and one green, driving on the road. Several people are walking on the street, and there are various shops and buildings on either side of the street. The sky is blue with some clouds.
For the above image, the model was prompted to describe the scene in Santhali (a low-resource Indian language). Instruction following for such long-tail requests can be low quality.
Experience Sarvam Vision & Get Started with Document Intelligence API Today
Sarvam Visionโs Document Intelligence is built to handle real-world, production-grade workloads and weโre just getting started! To kick things off and accelerate adoption, weโre making the Document Intelligence APIs & Vision experience completely free for the entire month of February, 2026. This is your chance to push the model to its limits, experiment at scale, and start building with zero friction.
Want to try it right away?Jump into our no-code, interactive experience on the Sarvam API Platform. Simply log in and enjoy unlimited usage for the month of February!https://dashboard.sarvam.ai/
Ready to integrate into your product?Head over to our API Developer Docs for ready-to-use SDKs, clear examples, and everything you need to get production-ready in minutes.
Building something exciting?Join our Discord Developer Community to stay up to date on new releases, share feedback, and collaborate directly with the Sarvam team.
Weโre excited to work closely with developers and partners to build on this strong foundation and unlock powerful downstream applications across education, healthcare, video intelligence, and more. Nowโs the time to explore, experiment, and build with Sarvam Vision.
Curious what else we're building? Explore our APIs and start creating.
Curious what else we're building?
Explore our APIs and start creating.