Olá pessoal, meu nome é Mauricio Junior e estou disposto a mostrar como utilizar uma expressão para retirar tags HTML dos campos antes de ser gravado no banco de dados. É simples e fácil, precisamos apenas entender como funciona e utilizarmos.

 

Recursos utilizados:

1 – Visual Studio.NET 2005;

2 – Linguagem C#.NET

3 – Expressão.

 

Livros publicados pelo autor

 

Livros publicados do autor 

 

 

         Antes de tudo para quem possui o MSDN instalado em sua máquina, segue o link abaixo para utilizar e ver os exemplos. (Referência 1.1)

 

 

ms-help://MS.MSDNQTR.v80.en/MS.MSDN.v80/MS.VisualStudio.v80.en/dv_fxfund/html/521b3f6d-f869-42e1-93e5-158c54a6895d.htm

 

Referência: 1.1

 

 

         Expressões regulares provê um poderoso, flexível e eficiente método de processo de texto. A notação padrão adequado de expressões regulares permite que você analise rápido e gramaticalmente quantidades grandes de texto para encontrar testes padrões específicos do caráter; para extrair, editar, substituir, ou suprimir substrings do texto; ou para adicionar resultados extraídos a uma coleção a fim gerar um relatório. Para muitas aplicações que tratam das distribuições com strings (tais como o HTML que processa a linha de registro que analisa gramaticalmente, e o encabeçamento do HTTP que analisa gramaticalmente), as expressões regulares é uma ferramenta indispensável.

 

Na Prática

 

         Na prática, é simples fazer este tipo de solução. Não tem problema deixar o usuário digitar tags HTMLs, porém antes de gravar os dados pode ser feito um tratamento para tirar todas os comandos indesejados. Por exemplo: tudo que estiver dentro de tag <html> ou <b> ou <input> serão retirados automaticamente ficando apenas o texto digitado fora da tag. Referência 1.2

 

 

<b>teste</b>

<h1>titulo qualquer</h1>

<h5>texto</h5>

 

Referência: 1.2

 

         O resultado da referência 1.2 fica da assim. (Referência 1.3)

 

 

teste

titulo qualquer

texto

 

Referência: 1.3

 

         O resultado da referência 1.3 mostra apenas o texto digitado sem qualquer configuração ou tag html. Note que todas as tags foram retiradas.

 

Expressão Utilizada

 

         A expressão utilizada é tranqüila. (Referência 1.4)

 

 

String retornoSemTag =

      System.Text.RegularExpressions.Regex.Replace(txtMensagem.Text, 

      "<[^>]*>", " ");

 

Referência: 1.4

Explicação:

 

         Primeiro de tudo, criei uma variável do tipo String atribuindo o resultado da expressão, ponto Replace(passando o campo do formulário, a expressão, vazio). Esse vazio faz apenas a troca das tags por nada. Essa String retornoSemTag é a variável pronta para ser inserida no banco de dados sem qualquer problema.

 

         Bom, fico por aqui com mais um artigo e espero que possa ter ajudado a você leitor. Qualquer dúvida, favor entrar em contato através do e-mail mauricio@aspneti.com.

 

Maurício Junior

www.aspneti.com

www.mauriciojunior.org