Estratégias para viabilizar um "BI desestruturado"

Cada vez mais, as pessoas esperam utilizar novas fontes de informação para testar suas ideias e seus cenários. Adicione o dinamismo crescente no uso das informações, e você terá de juntar não apenas sistemas de informações mas também usos diferentes das informações por usuários diferentes. Ou seja, seria impossível conectar todas as fontes de informação ao seu sistema de análise ou até mesmo gerenciar seu uso. Para atender à essa demanda, a área de TI já liderou diversas iniciativas, mas o apetite por novos relatórios e novas análises não para de crescer.

Esse problema ocorre porque os sistemas de BI existentes atualmente foram construídos para trabalhar com modelos estruturados de dados, mas não estão preparados para trabalhar com uma nova demanda: o (re)uso das informações estruturadas pertencentes ao seu banco de dados combinadas com informações externas (e quase sempre estruturadas de uma maneira diferente de seu padrão), o que a PwC denomina de BI desestruturado.


Os sistemas de BI tradicionais não estão prontos para lidar com as todas as fontes e modelos desestruturados de informação.


Tom Flanagan, CIO da Amgen, resume o problema: “É difícil conseguir uma descrição exata dos requerimentos das áreas usuárias. Partindo dos nossos sistemas atuais, invariavelmente, acabamos por construir cubos de dados baseados na informação passada pela área usuária. Mas, muitas vezes, o cubo construído não atende à expectativa da área usuária. Ou melhor, atende ao que foi solicitado, mas o desejo real é por um tipo de relatório que permita detalhar as informações nos mais diversos níveis de detalhe. Resumindo: o problema é que a maneira conhecida de se montar relatórios não atende à flexibilidade desejada pelos usuários.”

 

Uma arquitetura mais flexível

Os sistemas de BI foram criados com a seguinte premissa: quanto mais informações você tiver, melhor a sua análise. Contudo, essa afirmação não é totalmente verdadeira, uma vez que nem todos os cenários analisados são estáticos, conhecidos ou previsíveis, ou seja, possíveis de automação. O conceito de dados conectados (para mais detalhes, leia o artigo “Spinning a Data Web” ou consulte o site http://linkeddata.org/ para uma descrição detalhada desse conceito) parte dessa incapacidade, focando na identificação de informações relevantes e como analisá-las.

Utilizar o conceito de dados conectados é importante, porém não há garantia de sucesso. O uso indiscriminado de ferramentas, com base nos conceitos RDF (Resource Description Framework – Padrão de Descrição de Recursos), OWL (Web Ontology Language – Linguagem de Ontologias da Web), entre outras ferramentas de Web Semântica, pode criar uma inconsistência nas informações similar àquela causada pelo uso de planilhas eletrônicas. Por isso, o CIO deve criar um padrão para explorar as informações existentes nas fontes de dados selecionadas, em vez de tentar controlá-las. “Sempre haverá muitas fontes de dados e sempre haverá novos tipos de dados... por isso, precisamos de uma arquitetura capaz de lidar com essa mudança,” afirma Lynn Vogel, vice--presidente e CIO do M.D. Anderson Cancer Center, um hospital e centro de pesquisas sediado em Houston (EUA).

 

Algumas vantagens dos dados conectados

O conceito de dados conectados, ao contrário do conceito atual de data warehousing, aceita que as informações estejam estruturadas de maneiras diferentes dependendo do propósito em que foram criadas. O conceito de dados conectados tenta unir essas diferenças utilizando semânticas (o significado dos dados no contexto) e ontologias (relacionamento entre as fontes de dados). O uso desse conceito complementa arquiteturas de sistemas baseadas em SOA, sistemas analíticos conectados entre si e arquiteturas direcionadas a eventos que interagem para garantir um resultado flexível e dinâmico de acordo com as fronteiras estabelecidas.

 

Dois caminhos para explorar os dados conectados

A PwC recomenda que os CIOs repensem sua estrutura de dados/informações considerando a utilização de dados conectados. Não se trata de começar uma iniciativa revolucionária, mas sim testar alguns dos princípios desse conceito. Apresentamos algumas sugestões para implementar essas iniciativas.

O primeiro deles é ampliar seu data warehouse e demais repositórios com metadados orientados por semânticas e ontologias. Com essa ampliação, os dados estarão prontos para serem explorados por meio de contextos, permitindo, assim, que seus usuários possam utilizá-los em novas aplicações.

O segundo caminho possível é disponibilizar ferramentas de exploração que possam ser usadas com os dados existentes em seus sistemas, bem como com outras fontes de dados alternativas. Essas ferramentas permitirão que os usuários utilizem os melhores dados para cada situação mediante o uso do conceito de dados conectados a um baixo custo para a área de TI.

As duas abordagens partem de um princípio comum: estabelecer uma ontologia única (e básica) para o negócio, capaz de exprimir as relações entre os principais processos de negócios e suas entidades de dados. A ontologia traz um padrão único, que permite a conexão de diversas fontes de dados para gerar análises e filtros considerando as diversas origens de informação. Um exemplo disso é o modelo utilizado pela Chevron (veja o esquema na figura 2 e a entrevista com Frank Chum na edição completa do Technology Forecast).

 

Criando uma estratégia para conectar dados

Dada a importância dos dados conectados para habilitar a camada de mediação de informações, é importante que o CIO conheça esse conceito. O CIO é a pessoa mais indicada para difundi-lo por conhecer os sistemas existentes na companhia e ter uma visão completa de como eles deverão estar conectados para atender às demandas do negócio.

Outro ponto que vale a pena destacar é que a adoção desse conceito ajudará as organizações a compreenderem o problema do BI desestruturado e como poderiam resolvê-lo.

 

Criando um padrão para inovação

O “I” do termo CIO significa informação, por isso ele ou ela é a pessoa mais indicada para liderar a organização no uso de ontologias, semânticas e metadados. Sendo assim, o CIO deve liderar o desenvolvimento das ontologias para o negócio auxiliando as áreas-chave do negócio a definirem seus subconjuntos de ontologias. Assim, o CIO e os gerentes de negócio terão subsídio para criar metadados em seus sistemas corporativos, agilizando e melhorando a qualidade das análises (veja a figura 3).

É possível mostrar o uso desse conceito na análise da relação entre fornecedores e consumidores ao permitir uma avaliação mais ampla dos dados transacionais que combinem dados desestruturados para explorar as informações existentes (de alternativas de produtos até demandas não atendidas). Com o uso das ontologias, você poderia utilizar sua base estruturada de dados sem ter de transformá-los para extrair todas essas informações.

Ao pensar em sua ontologia e semântica de dados para criar um padrão eficiente do uso de dados conectados, você revisará sua arquitetura atual de dados, permitindo definir qual a rigidez de suas ontologias e semânticas. Por exemplo, um cliente pode ser algo contextual, como clientes internos, um parceiro de negócio ou um consumidor final; dessa forma, a ontologia deve permitir tal flexibilidade. Por outro lado, um número de material é algo fixo e deve ser tratado como tal.

 

Auxiliando a análise dos usuários finais

O benefício obtido com o uso de uma camada de mediação de dados é mais perceptível nas unidades de negócios, nas quais os analistas e outros usuários utilizam as informações existentes em análises. “Com os dados conectados de maneira correta, as pessoas podem resolver os quebra-cabeças sozinhas”, nota Uche Ogbuji, um sócio da Zepheira, empresa provedora de treinamentos e soluções com base em semânticas. Ele ainda adiciona que, no passado, juntar as peças do quebra-cabeças era um desafio, que envolvia um esforço considerável na estruturação de dados, para permitir análises da maneira tradicional.


Uma boa analogia para a determinação do nível de controle necessário para os dados conectados é comparar o uso dos dados à qualidade das imagens em um telescópio: quanto mais distante as informações estiverem de suas origens, menos precisas elas serão; por isso, os usuários podem ter maior liberdade para interpretá-las e determinar seu contexto nas análises.


 

Uso estratégico da informação

A mágica por trás dessa conexão inteligente de informações por meio dos dados conectados reside no fato de que a normatização de informações é um estado transiente, deixando os dados originais intactos. Essa característica facilita o uso de dados externos – originados na Web, brokers e demais fontes de informação - para as análises corporativas.

O ponto-chave para as análises é mapear os metadados de diversas fontes por meio do uso de ontologias e ferramentas de semântica para cada operação. Pense nesses mapeamentos de dados conectados como um mashup de informações. Esse mashup adiciona sentido às informações que estão sendo analisadas, e esse contexto faz com que a análise seja útil (veja a entrevista de Tom Scott da BBC Earth sobre o uso de mashups na edição integral deste Technology Forecast).

Além disso, a abordagem de dados conectados permite que a “colaboração entre departamentos distintos seja algo real, porque não é necessário um acordo definitivo entre eles. A tecnologia proposta (dados conectados) torna esse acordo algo dinâmico, refletindo seu estado atual nos esquemas semânticos”, afirma Uche Ogbuji.

Um CIO deve considerar essas abordagens em sua agenda, que podem auxiliar sua empresa a ser mais competitiva, melhorando seu desempenho pelo uso estratégico das informações existentes. Inserir a mediação de informações pelo uso de dados conectados colocará o CIO em uma posição de destaque estratégico nas organizações, em vez de ser o responsável por focar nos bits e bytes que podem ser tratados por parceiros e membros da equipe de TI.

Voltar ao topo