Integrazione e integrità dei dati

Integrazione di Big Data, Cloud e IoT

Con l'esplosione dei tipi di dati di nuova generazione, i processi tradizionali non sono più sufficienti. È necessaria una piattaforma di gestione dei dati progressiva con best practice e strumenti di integrazione dei dati incorporati, distribuiti nei locali, nel cloud o attraverso una combinazione di entrambi, per fornire dati pertinenti utilizzabili per il consumo in tutta l'azienda.

Integrazione Hadoop™ più semplice e intelligente

  • Una piattaforma creata per Big Data, preparazione dei dati e coinvolgimento nativo di Hadoop
  • Strumenti grafici visivi per creare, collaborare e controllare i big data per velocizzare il time-to-market
  • Inserimento progressivo incorporato di dati: strutturato, non strutturato e sociale
  • Costruite nelle migliori pratiche per la coerenza dei dati tra le applicazioni operative
  • Movimento dei dati a destra per operare a più velocità
  • Migliaia di implementazioni per la gestione dei dati, lo spostamento, l'integrazione e la BI

Caratteristiche principali

Streaming in tempo reale di transazioni, batch o dati modificati (delta) per l'elaborazione di dati bidirezionale

I dati in streaming e non strutturati includono supporto per Flume, Spark e Hadoop

  • Dati in movimento: coda dei messaggi usando Kafka e data wrangling
  • DData a riposo (dati nei database)
  • DSqoop per Hadoop
    • Porta metadati dal database e li crea su Hadoop
    • Supporta la cattura dei dati modificata
    • Supporto di tutti i tipi di file che Hadoop supporta
    • Pipeline (usesark)
    • Supporta la trasformazione e qualità dei dati in-pipeline

Consente l'inserimento dei dati a riposo da sorgenti relazionali, altre sorgenti Hadoop e sorgenti NoSQL, oltre che a snellire i dati e il data wrangling con elaborazione del linguaggio naturale e qualità dei dati integrata

  • Qualità dei dati pervasiva
    • ICleansing
    • IEnriching
    • IStandardizing
    • IMatch
    • IMerge
       

Completo supporto alla trasformazione su sorgenti e obiettivi multipli di dati che consente la rapida implementazione e il lavoro di gruppo in parallelo

Offre interazioni umane migliorate per aiutare i data steward a guidare il processo di integrazione

Abilita applicazioni complete per l'integrazione dei dati end-to-end

Rappresentazione visiva di trasformazione da sorgenti come Hadoop, Scala e Spark con funzioni di qualità dei dati predefinite e diffuse codificate per un time-to-market più rapido

  • Trasformazione di dati costruiti visivamente dai dati su Hadoop
  • Costruisci codice in Map Reduce e Scala (può eseguire inark)
  • Supporto completo di aggregati e funzioni scalari SQL
  • Elenco di funzioni di qualità dati diffuse e codificate in BDI (30)
  • I Transform Target possono essere tabelle Hive, tabelle di database relazionali o formati IDS on-ramp
  • Supporto per Spark
    • Supporto completo per Java, Scala, Python
    • Crea build script
    • Gestisce tutte le dipendenze
    • Consente di implementare ed eseguire e creare nodi e debug
    • Modelli predittivi, GraphX, Match and Merge, streaming, SQL
  • Supporta una varietà di protocolli inbound e outbound disponibili per ogni applicazione, sistema o prodotto analitico
  • Elaborazione della transazione a lotti, delta e in tempo reale con completo supporto streaming

La facilità di progettazione nell'organizzazione è semplificata tramite modellazione, integrazione e servizi di recupero preconfigurati e pronti per l'uso con visualizzazione