New approach to formal grammars. (Doktorandem výzkum)

25 de October de 2015

This is the Introduction of my Ph.D. research project. Soon I’ll post the whole project in pdf.


New approach to formal grammars: Pāṇini’s grammar as an answer.


The form is the possibility of the structure.

L.Wittgenstein (T.L.Ph., 2.033)





Since Noam Chomsky said the Pāṇini’s grammar (PG) is a “generative grammar, in essentially the contemporary sense of this term” (1965: v), a new perspective in the studies of Aṣṭādhyāyī has appeared. Some linguists trained in PG have been asserting  the link between PG and generative grammar at least since 1965, even assuming that PG is within a specific hierarchy of the Chomsky Hierarchy[1]. But none of them ever questioned the Chomsky’s theory, on the contrary, just accepted it and have applied it to PG its whole framework, however, “the generative perspective has misled linguists concerning the properties of natural language” (Pullum: 2003).

The formalization of grammars has been very restricted to what we call generative frameworks, and these frameworks have been considered theoretically important for any description of natural language without proving empirically its efficacy. It is like saying that for the formal grammar have its potential proved, it has to pass through an analysis of a generative framework, known as mathematical foundations. PG has been a victim of Chomsky’s theory since his declaration. When some linguists trying to apply these new models of framework to PG to prove that PG can be one kind of generative grammar, we see two mistakes: first, to turn PG’s framework to generative framework (something that contributes to PG to lose its linguistic potential); second, to lose the oportunity to challenge Chomsky’s theory with a grammar that describes a language (Sanskrit, in this case) with total efficacy, and empirically.

My research goes in this new perspective, not trying to demonstrate that PG is one kind of generative grammar, but to prove that PG’s method is efficient for describing any natural language. PG will be proved as a model grammar, meaning that it can be applied at least to every natural language in the Indo-european family. This approuch implies two important points: outdo the Chomsky’s theory of grammar (note that I am discussing grammars, not languages); provide a framework completely linguistic for description of languages (avoiding mathematical foundations). With the second point is possible to affirm that PG can even be a model of grammar for Natural Language Processing (NLP).

If a generative grammar is a “system of rules that in some explicit and well-defined way assigns structural descriptions to sentences” (Chomsky, 1965: 8), the grammar of Pāṇini could be considered a generative grammar, but the main problem to consider it as this kind of grammar is that for Pāṇini the objects that linguists investigate (words, phrases, clauses, sentences, lexemes, syllables) are real and have a real structure, than “merely structures imposed on them or posited for them by linguists” (Pullum:2007). The PG is known as saṃjñaka vyākaraṇa, a grammar of categories of technical terms (Kapoor, 2005:70). For Pāṇini, to generate a language (Sanskrit), one grammar firstly must describe it, and if its description is not real, the generation is not effectual. In the end, PG exposes the mistakes that have been investigated by generative linguists.[2]

Google Translate needs a grammar device.

12 de February de 2015

I think it was Steve Jobs who said for connecting the dots we should look backwards, and not forward. Regarding machine translation I think Google would improve much more its translator if it looked backwards. Last month Google launched their update for Google Translate, it is amazing technology resulting from machine learning area. I tested almost all the languages thinking that the translations would get better, but they didn’t. This is why Google cannot say it has now a “more powerful translation tool”. A powerful translation tool must translate better than Google Translate (GT).


The new update is based on machine learning and artificial intelligence. The system is still based on linguistic corpus and statistics. Google feeds the system with words from all languages the translator works with (the number now is more or less 200 billions) and applies the statistics; from high statistical matches among the languages come the translations we are used to see on Google Translate. The system does not translate, but learns from existing human translations, Google use a lot of UN Documents for it.


Now, according with Jeff Dean (the Google legend behind Google Brain), Google is searching “a better form of real-time translation” with deep learning and AI, this new model would use “only neural-nets to do end-to-end languages translation”.


Would a model like that build a better machine translation? I think no.


Let me explain like this:



A machine translation cannot be good enough without using a grammar.



Assuming that:

(a) a translation is a technique

(b) the syntactic-semantic relation is the core of any translation


We have:


Hypothesis 1.

The translator (human or machine) operates two processes:

(a) describes a source language (input L)

(b) generates a target language (output L) [no native speaker also describes output L]


Hypothesis 2.

The translator must generate output L with grammaticality.

[Grammaticality = understandable by native speaker]


Combining (a) and (b) to H1 and H2 is possible to see that a translator (machine or human) needs a grammar as a device for its/his technique.


Let us give one step forward.


In the GT video says by statistics the machine discovers grammar by itself from every text in every language analyzed. But this “grammar” is based on match, and therefore, it is very weak to describe or to generate languages.



Linguistic corpus is fundamental to any translation process (human or machine).


Accepting that every machine translation is a written machine translation, even using “speech to speech”, we have:



A machine can make a standard translation if and only if it has the assistance of a grammar device working like a filter.



Consider two languages, English E and Czech C, for translating one simple sentence S (“you are beautiful”), from E to C, testing in the Google Translate app:

You are beautiful < E (automatically gives) C > Jste krásná

But the translation S=E>C can be also:

C > Jste krásný / Jsi krásná – Jsi krásný) / Jsou krásné

For C > we have Second person plural feminine, masculine (formal); Second person singular feminine, masculine (informal); Third person plural feminine/masculine. In Google’s term “pattern” we have: one pattern E to six patterns C (with E using three elements and C using two). We have a gradation in the adjective ‘beautiful’, at E>C, and it can be translated for “nádhera” and “krásná”. The S in E does not have gender, whereas in C we can have two (f, m). With the S in E suppose the personal pronoun has a mark of emphasis, then the S in C will have more five possible “patterns” (ty, vy, oni/ony/ona). This if we accept the S without context, once in context the analysis would be even more complex for a machine. To describe or to generate this S we can see: machine translations need a grammar device working as a filter – something that a human native speaker has naturally. And if we accept the thesis that native speakers cannot “classify [naturally] any sentence over the vocabulary of their language consistently as either grammatical or ungrammatical” (R.J. Matthews, Are the grammatical sentences of a language a recursive set?, 1979, p. 211), Google Translate will need even more a grammar device working like a filter.


From now on my main subject is this grammar device. How should it be?


A jewel.

26 de May de 2013

From Bhagavad Gīta (7.7).


मयि सर्वम् इदं प्रोतं सूत्रे मणिगणा इव

mayi sarvam idaṃ protaṃ sūtre maṇigaṇā iva

On me all this universe is strung like clusters of jewels on a string.

It’s a beautiful line of poetry. A metaphor, of course. Lives inside life.

But perhaps we can even see the string theory on it.

A causa material do universo. (se non è vero, è ben trovato)

21 de September de 2010


Semanas atrás, um dos físicos mais conhecidos e respeitados hoje, o Stephen Hawking, voltou a considerar a idéia de um universo não criado por Deus. E com esta declaração, o físico entrou num dos pontos cruciais da tradição vedānta – já estudado há milênios.

Para o físico e cosmólogo, os universos não precisariam de intervenção divina para serem criados, e mais, surgiriam do nada (ou do Nada?). O que chamam de Teoria-M.

A notícia – por conta do lançamento de seu novo livro The Grand Design – deixou-me com uma curiosidade enorme para rever o que a obra Vedānta Sūtra expõe a respeito.

E lá fui eu conferir…

Os aforismos abaixo estão no tópico 7, da sessão 4, do capítulo 1, este tópico é chamado de prakṛtyadhikaraṇam, ou o substrato da matéria.

प्रकृतिश्च प्रतिज्ञदृष्टान्तानुपरोधात्

prakṛtiśca pratijñadṛṣṭāntānuparodhāt (1.4.23)

Da não contradição de exemplo e proposição, (o Absoluto é) também (a causa) material.


abhidhyopadeśācca (1.4.24)

Da referência ao desejo.


sākṣāccobhayāmnānāt (1.4.25)

É (causa) direta, por conta da menção de ambos (criação e dissolução).

आत्मकृतेः परिणामात्

ātmakṛteḥ pariṇāmāt (1.4.26)

Autocriado por causa da transformação.

योनिश्च हि गीयते

yoniśca hi gīyate (1.4.27)

E é chamado, certamente, a origem.

Detalhe: os sūtra são como “mensagens de telegrama”, temos de compor o sentido.

1)      No primeiro sūtra, o Absoluto (braḥman) é colocado como causa material. E o que se entende por causa material é: a condição de que uma coisa é feita. Assim, a condição aqui é a intervenção divina. E o aforismo nos alerta para uma suposta não-contradição, a partir de exemplos e proposições dos textos (śastra), da causa ser dita de outros modos também (ca). Nesta parte é exposta a causa material.

2)      Neste segundo aforismo, é dito por que o Absoluto criou o universo. Simples, os universos foram criados porque Deus assim o desejou. Na verdade, por causa do desejo. Já por que o Absoluto desejou, bem, aí temos um mistério.

3)      Agora, neste terceiro aforismo, diz-se que a causa é direta, ou seja, este desejo é quase que um toque, aliás, não um toque, mas um olhar. Isso porque os śruti, os textos revelados, mencionam o Absoluto como causa direta de ambos (ubhaya), criação e dissolução dos universos. Aqui estaríamos falando de um momento de grande importância (e dúvidas) para os cientistas: o momento antecedente ao tal do Big Bang – tipo “o que gerou esta explosão?”. Resposta vedantina: o olhar de Deus – o único que estaria de início fora da matéria e, portanto, possível de dar o início à sua criação.

Antes de entrar na explicação dos 4º e 5º sūtra, pois o 4º talvez seja o que melhor toque a tal da Teoria-M, é bom que se diga que o ponto principal tocado pelo físico nesta nova descoberta é a lei da gravidade. Diz o cientista que por ela existir “o universo pode e irá criar a ele mesmo do nada”. Mas vejamos: esta lei não é uma lei da matéria? Não é uma lei que gera força entre dois objetos? Não faz parte do universo, do espaço? Acho que é fácil concordar que sim. Então, é uma lei que só existe na matéria. E se é uma lei que só existe na matéria, ela não pode explicar o “pontapé inicial” – ou a primeira olhada – que determina a matéria, ou seja, que está antes da matéria. Porque se existe uma criação da matéria, existe algo (ou um momento) antes que não é matéria, e neste algo ou momento naturalmente não existe a lei da gravidade. Na linguagem do físico: não pode haver a lei neste “nada” de onde ele acredita que os universos podem ser criados. Assim, a lei não é (nem pode ser) prova de que os universos não são criados pelo Absoluto. E voltamos de novo a velha questão dos cientistas: o que fez com que o Big Bang acontecesse? Porque não precisa ser físico para saber que uma explosão não acontece do nada.

Ele também fala da possibilidade de múltiplos universos – os multiversos. Mas isso está exposto nos śruti, os primeiros textos revelados, com uma riqueza de detalhes enorme e corroborados, inclusive, por cálculos matemáticos – será que eles nunca foram consultar textos antigos que não fossem os gregos?

Voltemos aos 4º e 5º sūtra.

4)      Já expliquei sobre a palavra ātmā aqui. Neste 4º aforismo ela significa “auto”, o que forma autocriado, ou seja, o mundo cria-se por ele mesmo. Mas aqui, é bom lembrar, estamos falando da criação num segundo estágio, digamos; a olhada de início – que na física seria o que originou o tal do Big Bang – já foi dada. Este é o sūtra que nos traz a evidência do Absoluto não mais participar da criação logo depois de ter olhado para ela. Ou seja, o Absoluto primeiro olha para a matéria e depois esta matéria começa a se criar, ou autocriar, e isso vem da transformação que acontece na própria matéria, da não-forma para a forma. Mas sem esse olhar direto (sākṣāt) nada acontece. Também temos aqui – importante – uma segunda leitura, caso vemos a palavra ātmā não mais como o pronome “auto”, mas como o substantivo alma; aí teríamos o aforismo nos dizendo que a criação é dada pela alma, ainda a partir da transformação. Esta leitura é justa porque a alma seria, no contexto vedantino, um segundo desdobramento do Absoluto e o responsável, na verdade, de dar vida à matéria. Sem alma a matéria não vive, não se forma. Num contexto mais mitológico, a alma seria este olhar de Deus.

Assim, podemos dizer que quando o Stephen Hawking afirma que criação espontânea é a razão pela qual algo existe ao invés de não existir nada, em parte ele está certo, mas o fato de não saber – e os cientistas não sabem – em que fase acontece este tipo de criação e determinar esta fase como a fase inicial, não nos diz que ela seja realmente a inicial.

5)      Já este 5º aforismo é claro, e conclusão dos outros quatro antecedentes; colocado em pormenores, depois do mencionado, é certo (hi) que o Absoluto é a origem.

Não sei quanto a vocês, leitores, mas eu, certamente, prefiro acreditar nas palavras dessa obra antiga, analisada, meditada e corroborada através dos milênios por uma tradição de conhecimento, hoje em paridade com muitas descobertas da física quântica, do que ter a palavra do senhor Stephen Hawking como verdadeiras e definitivas.

