top 64 informatica interview questions with answers
Domande e risposte ai colloqui di Informatica più frequenti:
Questo articolo copre le principali domande su Informatica MDM, PowerCenter, Data Quality, Cloud, ETL, Admin, Testing e Developer.
Nello scenario odierno, INFORMATICA ha ottenuto il tag di un prodotto più esigente in tutto il mondo. I suoi prodotti sono stati introdotti di recente ma sono diventati popolari in breve tempo.
INFORMATICA negli anni ha agito come leader nel campo della tecnologia, Data Integration. Basato sull'architettura ETL (Extract, Transfer, Load), questo strumento di integrazione dei dati ha diversi prodotti che si concentrano sulla fornitura di servizi per organizzazioni governative, società finanziarie e assicurative, assistenza sanitaria e molte altre aziende.
Ebbene, questo era solo lo sfondo di INFORMATICA. Ma oggi, il campo del data warehousing ha una crescita enorme e quindi molte opportunità di lavoro sono disponibili nel settore.
Le migliori domande e risposte ai colloqui di Informatica
Di seguito è riportato un elenco delle domande e risposte dell'intervista più frequenti. Comprende circa 64 domande che, a loro volta, ti consentiranno di approfondire le tue conoscenze sui concetti di Informatica in modo più semplice.
Q # 1) Cos'è INFORMATICA? Perchè ne abbiamo bisogno?
Risposta: INFORMATICA è una società di sviluppo software che offre alcune soluzioni di integrazione dati per ETL, virtualizzazione dei dati, gestione dei dati master, qualità dei dati, replica dei dati, ultra messaggistica, ecc.
Alcuni dei popolari prodotti INFORMATICA sono:
- INFORMATICA PowerCenter
- INFORMATICA PowerConnect
- COMPUTING Power Mart
- INFORMATICA Power Exchange
- INFORMATICA Analisi di potenza
- INFORMATICA Power Quality
Abbiamo bisogno di INFORMATICA mentre lavoriamo con sistemi di dati che contengono dati per eseguire determinate operazioni insieme a una serie di regole. Facilita la pulizia della linea operativa e la modifica dei dati da sistemi di dati strutturati e non strutturati.
D # 2) Qual è il formato degli oggetti INFORMATICA in un repository? Quali sono i database che può connettersi a Windows?
Risposta: Gli oggetti INFORMATICA possono essere scritti in formato XML.
Di seguito è riportato l'elenco dei database a cui può connettersi:
- server SQL
- Oracolo
- Accesso MS
- MS Excel
- DB2
- Sybase
- Teradata
D # 3) Cos'è INFORMATICA PowerCenter?
Risposta: È uno strumento ETL / Data Integration che viene utilizzato per connettere e recuperare dati da diverse fonti e l'elaborazione dei dati. PowerCenter elabora un volume elevato di dati e supporta il recupero dei dati da fonti ERP come SAP, PeopleSoft, ecc.
È possibile collegare PowerCenter a sistemi di gestione di database come SQL e Oracle per integrare i dati nel terzo sistema.
D # 4) Quali sono le diverse edizioni di INFORMATICA PowerCenter disponibili?
Risposta: Diverse edizioni di INFORMATICA PowerCenter sono:
- edizione standard
- Edizione avanzata
- Edizione Premium
L'attuale versione di PowerCenter disponibile è la v10 con un aumento delle prestazioni elevate.
D # 5) Come puoi distinguere tra PowerCenter e Power Map?
Risposta: di seguito sono riportate le differenze tra PowerCenter e Power Map.
INFORMATICA PowerCenter | INFORMATICA PowerMart | ||
---|---|---|---|
5858 | 4566 | 3550 | 23/01/2016 |
1. | Elabora un volume elevato di dati | Elabora un volume ridotto di dati | |
Due. | Supporta archivi globali e locali | Supporta solo i repository locali | |
3. | Supporta il recupero dei dati da ERP Fonti come SAP, PeopleSoft ecc. | Non supporta il recupero dei dati da fonti ERP | |
Quattro. | Converte i repository locali in globali | Non convertire i repository locali in globali |
D # 6) Quali sono i diversi componenti di PowerCenter?
Risposta: di seguito sono riportati i 7 componenti importanti di PowerCenter:
- Servizio PowerCenter
- Client PowerCenter
- Repository PowerCenter
- Dominio PowerCenter
- Servizio di repository
- Servizio di integrazione
- Console di amministrazione di PowerCenter
- Hub del servizio Web
D # 7) Quali sono i diversi client di PowerCenter?
Risposta: ecco l'elenco dei client PowerCenter:
- Designer di PowerCenter
- Monitor del flusso di lavoro di PowerCenter
- Gestore del flusso di lavoro di PowerCenter
- Gestore del repository di PowerCenter
D # 8) Cos'è INFORMATICA PowerCenter Repository?
Risposta: PowerCenter Repository è un database relazionale o un database di sistema che contiene metadati come,
- Definizione della fonte
- Definizione del target
- Registri di sessione e sessione
- Flusso di lavoro
- Connessione ODBC
- Mappatura
Esistono due tipi di repository:
- Archivi globali
- Archivi locali
PowerCenter Repository è necessario per eseguire l'estrazione, la trasformazione e il caricamento (ETL) in base ai metadati.
Q # 9) Come elaborare il livello di tracciamento?
Risposta: Il livello di traccia può essere definito come la quantità di informazioni che il server scrive nel file di registro. Il livello di traccia viene creato e configurato a livello di trasformazione o a livello di sessione, altrimenti a entrambi i livelli.
Di seguito sono riportati i 4 tipi di livello di tracciamento:
- Nessuna
- Conciso
- Inizializzazione dettagliata
- Dati dettagliati
Q # 10) Come elaborare il servizio di integrazione PowerCenter?
Risposta: I servizi di integrazione controllano il flusso di lavoro e l'esecuzione dei processi di PowerCenter.
Ci sono tre componenti dei servizi di integrazione di INFORMATICA come mostrato nella figura seguente.
Processo del servizio di integrazione: Si chiama pmserver, il servizio di integrazione può avviare più di un processo per monitorare il flusso di lavoro.
Bilancio del carico: Il bilanciamento del carico si riferisce alla distribuzione dell'intero carico di lavoro su diversi nodi della griglia. Un bilanciatore del carico esegue diverse attività che includono comandi, sessioni, ecc.
Data Transformation Manager (DTM): Data Transformation Manager consente di eseguire le seguenti trasformazioni di dati:
- Attivo: Per modificare il numero di righe nell'output.
- Passivo: Impossibile modificare il numero di righe nell'output.
- Collegato: Collegamento all'altra trasformazione.
- Non connesso: Nessun collegamento ad altre trasformazioni.
Q # 11) Cos'è PowerCenter on Grid?
Risposta: INFORMATICA ha la caratteristica del Grid computing che può essere utilizzato per la massima scalabilità dei dati in ordine alle prestazioni. La funzionalità griglia viene utilizzata per il bilanciamento del carico e l'elaborazione parallela.
I domini PowerCenter contengono un insieme di più nodi per configurare il carico di lavoro e quindi eseguirlo sulla griglia.
PER dominio è una base per un'amministrazione efficiente del servizio servita da PowerCenter.
Nodo è una macchina fisica indipendente rappresentata logicamente per l'esecuzione dell'ambiente PowerCenter.
D # 12) Che cos'è il data warehouse aziendale?
Risposta: Quando una grande quantità di dati viene assemblata in un unico punto di accesso, viene chiamata Enterprise Data Warehousing. Questi dati possono essere riutilizzati e analizzati a intervalli regolari o secondo le necessità del tempo richiesto.
Considerato come il database centrale o, diciamo, un unico punto di accesso, il data warehousing aziendale fornisce una visione globale completa e quindi aiuta nel supporto decisionale.
Può essere più compreso dai seguenti punti che ne definiscono le caratteristiche:
- È possibile accedere a tutte le informazioni aziendali importanti archiviate in questo database unificato da qualsiasi punto dell'organizzazione.
- Sebbene il tempo richiesto sia maggiore, l'analisi periodica su questa singola fonte produce sempre risultati migliori.
- La sicurezza e l'integrità dei dati non vengono mai compromesse, rendendole accessibili in tutta l'organizzazione.
D # 13) Qual è il vantaggio del partizionamento della sessione?
Risposta: Mentre il servizio di integrazione è in esecuzione nell'ambiente, il flusso di lavoro è partizionato per prestazioni migliori. Queste partizioni vengono quindi utilizzate per eseguire l'estrazione, la trasformazione e il caricamento.
Q # 14) Come possiamo creare un indice dopo il completamento del processo di caricamento?
Risposta: Le attività di comando vengono utilizzate per creare un indice. Gli script delle attività di comando possono essere utilizzati in una sessione del flusso di lavoro per creare un indice.
Q # 15) Cosa sono le sessioni?
Risposta: La sessione è un insieme di istruzioni utilizzate durante lo spostamento dei dati dall'origine alla destinazione. Possiamo partizionare la sessione per implementare diverse sequenze di sessioni per migliorare le prestazioni del server.
Dopo aver creato una sessione possiamo utilizzare il server manager o il programma della riga di comando pmcmd per interrompere o avviare la sessione.
Q # 16) Come possiamo utilizzare i batch?
Risposta: I batch sono la raccolta di sessioni utilizzate per migrare i dati dall'origine alla destinazione su un server. I batch possono contenere il maggior numero di sessioni, ma causano più traffico di rete mentre è possibile spostare rapidamente un numero inferiore di sessioni in un batch.
D # 17) Che cos'è la mappatura?
Risposta: La mappatura è una raccolta di sorgenti e destinazioni collegate tra loro tramite determinati set di trasformazioni come Expression Transformation, Sorter Transformation, Aggregator Transformation, Router Transformation, ecc.
D # 18) Cos'è la trasformazione?
Risposta: La trasformazione può essere definita come un insieme di regole e istruzioni che devono essere applicate per definire il flusso di dati e il caricamento dei dati nella destinazione.
D # 19) Cos'è la trasformazione dell'espressione?
Risposta: È una trasformazione della mappatura utilizzata per trasformare i dati in un record alla volta. La trasformazione dell'espressione può essere passiva o connessa. L'espressione viene utilizzata per la manipolazione dei dati e la generazione di output mediante istruzioni condizionali.
D # 20) Che cos'è la trasformazione della strategia di aggiornamento?
Risposta: La strategia di aggiornamento in Informatica viene utilizzata per controllare i dati che lo attraversano e contrassegnarli come INSERT, UPDATE, DELETE e REJECT. Possiamo impostare una logica condizionale all'interno della trasformazione della strategia di aggiornamento per etichettarla.
D # 21) Cos'è la trasformazione del sorter?
come faccio ad aprire un file eps in Windows 10
Risposta: La trasformazione Sorter viene utilizzata per ordinare grandi volumi di dati attraverso più porte. È molto probabile che funzioni come la clausola ORDER BY in SQL. La trasformazione Sorter può essere attiva, passiva o connessa.
La trasformazione attiva passa attraverso la mappatura e cambia il numero di righe mentre la trasformazione passiva passa attraverso la mappatura ma non cambia il numero di righe.
La maggior parte delle trasformazioni INFORMATICA sono collegate al percorso Dati.
D # 22) Che cos'è la trasformazione del router?
Risposta: La trasformazione del router viene utilizzata per filtrare i dati di origine. È possibile utilizzare la trasformazione del router per suddividere una singola origine dati.
È molto simile alla trasformazione del filtro, ma l'unica differenza è che la trasformazione del filtro utilizza solo una condizione di trasformazione e restituisce le righe che non soddisfano la condizione, mentre la trasformazione del router utilizza più condizioni di trasformazione e restituisce le righe che corrispondono anche a una singola condizione.
D # 23) Cos'è la trasformazione del rango?
Risposta: La trasformazione del grado è attiva oltre che connessa. Viene utilizzato per ordinare e classificare un insieme di record in alto o in basso. Viene anche utilizzato per selezionare i dati con il valore numerico più grande o più piccolo in base a una porta specifica.
D # 24) Che cos'è l'indice di rango nella trasformazione di rango?
Risposta: L'indice di rango viene assegnato dal progettista di attività a ciascun record. La porta dell'indice di classifica viene utilizzata per memorizzare la posizione di classifica per ogni riga. La trasformazione della classifica identifica ogni riga dall'alto verso il basso e quindi assegna l'indice della classifica.
Q # 25) Cos'è il codice di stato in INFORMATICA?
Risposta: Il codice fornisce un meccanismo di gestione degli errori durante ogni sessione. Il codice di stato viene emesso dalla procedura memorizzata per riconoscere se è stato eseguito correttamente o meno il commit e fornisce informazioni al server INFORMATICA per decidere se la sessione deve essere interrotta o proseguita.
D # 26) Cosa sono le dimensioni spazzatura?
Risposta: La dimensione spazzatura è una struttura che consiste in un gruppo di alcuni attributi spazzatura come codici o flag casuali. Forma un framework per memorizzare i codici correlati rispetto a una dimensione specifica in un unico punto invece di creare più tabelle per lo stesso.
D # 27) Che cos'è Mapplet in Informatica?
Risposta: Mapplet è un oggetto riutilizzabile che contiene un determinato insieme di regole per la trasformazione e la logica di trasformazione che possono essere utilizzate in più mappature. Il Mapplet viene creato nel Mapplet Designer nello strumento di progettazione.
Q # 28) Cos'è Decode in Informatica?
Risposta: Per comprendere Decode, consideriamola simile all'istruzione CASE in SQL. È fondamentalmente la funzione utilizzata da una trasformazione di espressione per cercare un valore specifico in un record.
Ci possono essere ricerche illimitate all'interno della funzione Decode in cui viene specificata una porta per restituire i valori dei risultati. Questa funzione viene solitamente utilizzata nei casi in cui è necessario sostituire le istruzioni IF annidate o sostituire i valori di ricerca effettuando la ricerca in piccole tabelle con valori costanti.
La decodifica è una funzione utilizzata nella trasformazione dell'espressione. Viene utilizzato proprio come l'istruzione CASE in SQL per cercare un record specifico.
Di seguito è riportato un semplice esempio di CASE in SQL:
Sintassi:
SELECT EMPLOYEE_ID, CASE WHEN EMPLOYEE_AGE <= 20 THEN 'Young' WHEN EMPLOYEE_AGE> 30 AND AGE <= 40 THEN 'Knowledgeable' WHEN EMPLOYEE_AGE> 40 AND AGE = 60 THEN ‘Wise’ ELSE ‘Very Wise’ END AS EMPLOYEE_WISDOM FROM EMPLOYEE
Q # 29) Cos'è la trasformazione del falegname in INFORMATICA?
Risposta: Con l'aiuto della trasformazione di Joiner, puoi utilizzare i Joins in INFORMATICA.
Si basa su due fonti e cioè:
- Fonte principale
- Fonte dei dettagli
I seguenti join possono essere creati utilizzando la trasformazione di Joiner come in SQL.
- Join normale
- Join esterno completo
- Master Outer Join (Right Outer Join)
- Dettaglio unione esterna (unione esterna sinistra)
Q # 30) Cos'è la trasformazione degli aggregatori in INFORMATICA?
Risposta: La trasformazione dell'aggregatore può essere attiva o connessa. Funziona come la clausola GROUP BY in SQL. È utile eseguire calcoli aggregati sui gruppi in INFORMATICA PowerCenter. Esegue un calcolo aggregato sui dati utilizzando la funzione di tipo aggregato vale a dire. SOMMA, AVG, MAX e MIN.
D # 31) Che cos'è la trasformazione del generatore di sequenze in INFORMATICA?
Risposta: La trasformazione del generatore di sequenze può essere passiva o connessa. Il suo utilizzo di base è generare un valore intero con NEXTVAL e CURRVAL.
D # 32) Cos'è la trasformazione dell'Unione in INFORMATICA?
Risposta: La trasformazione dell'Unione viene utilizzata per combinare i dati da diverse origini e inquadrarli con la stessa porta e il tipo di dati. È molto simile a una clausola in SQL.
D # 33) Che cos'è la trasformazione del qualificatore di origine in INFORMATICA?
Risposta: La trasformazione del qualificatore di origine è utile nella mappatura, ogni volta che aggiungiamo file flat relazionali viene creato automaticamente. È una trasformazione attiva e connessa che rappresenta quelle righe che vengono lette dal servizio di integrazione.
Q # 34) Cos'è il Worklet INFORMATICA?
Risposta: Il Worklet funziona come un Mapplet con la caratteristica di riusabilità, l'unica differenza è che possiamo applicare il Worklet a qualsiasi numero di flussi di lavoro in INFORMATICA, a differenza di Mapplet. Worklet salva la logica e le attività in un unico posto per il riutilizzo.
Il worklet è molto simile al Mapplet ed è definito come il gruppo di attività che possono essere riutilizzabili o non riutilizzabili a livello di flusso di lavoro. Può essere aggiunto a tutti i flussi di lavoro necessari. Con la sua funzione di riutilizzabilità, si risparmia molto tempo poiché la logica riutilizzabile può essere sviluppata una volta e può essere posizionata da dove può essere riutilizzata.
Nell'ambiente INFORMATICA PowerCenter, i Mapplet sono considerati la caratteristica più vantaggiosa. Vengono creati nei designer Mapplet e fanno parte dello strumento Designer.
Fondamentalmente contiene una serie di trasformazioni progettate per essere riutilizzate nella mappatura multipla.
Si dice che le mapplet siano oggetti riutilizzabili che semplificano la mappatura:
- Comprese più trasformazioni e definizioni di origine.
- Non è necessario connettersi a tutte le porte di ingresso e uscita.
- Accetta i dati dalle origini e passa a più trasformazioni
Bene, nel complesso, quando è necessario riutilizzare la logica di mappatura, la logica dovrebbe essere collocata in Mapplet.
Q # 35) Cos'è SUBSTR in INFORMATICA?
Risposta: SUBSTR è una funzione che estrae o rimuove un set di caratteri da un set di caratteri più ampio.
Sintassi: SUBSTR (stringa, inizio (, lunghezza))
Dove,
corda definisce il carattere che vogliamo cercare.
inizio è un numero intero che viene utilizzato per impostare la posizione in cui deve iniziare il conteggio.
Lunghezza è un parametro opzionale che viene utilizzato per contare la lunghezza di una stringa per tornare dalla sua posizione iniziale.
Per esempio, SUBSTR (Contact, 5, 8), dove iniziamo dal 5 ° carattere del nostro contatto e torniamo agli 8 caratteri successivi.
D # 36) Che cos'è la compatibilità della tabella codici?
Risposta: Quando i dati vengono trasferiti dalla pagina del codice sorgente alla pagina del codice di destinazione, tutte le caratteristiche della pagina di origine devono essere presenti nella pagina di destinazione per evitare la perdita di dati, questa funzione è chiamata Compatibilità della pagina del codice.
La compatibilità della tabella codici viene visualizzata quando il server INFORMATICA è in esecuzione in modalità di spostamento dati Unicode. In questo caso, si dice che le due code page sono identiche quando i loro caratteri codificati sono virtualmente identici e quindi non si verifica alcuna perdita di dati.
Per una precisione completa, si dice che la pagina del codice sorgente è il sottoinsieme della pagina del codice di destinazione.
D # 37) Come puoi distinguere tra Connected LookUp e Unconnected LookUp?
Risposta: Connected Lookup fa parte del flusso di dati che è connesso a un'altra trasformazione, prende l'input dei dati direttamente da un'altra trasformazione che esegue una ricerca. Utilizza sia cache statica che dinamica.
Ricerca non connessa non prende l'input di dati da un'altra trasformazione, ma può essere utilizzata come funzione in qualsiasi trasformazione utilizzando l'espressione LKP (LookUp). Utilizza l'unica cache statica.
D # 38) Che cos'è l'aggregazione incrementale?
Risposta: L'aggregazione incrementale viene generata non appena viene creata una sessione. Viene utilizzato per calcolare le modifiche nei dati di origine che non modificano i dati di destinazione con modifiche significative.
CUSTOMER_NO | BILL_NO | QUANTITÀ | DATA |
---|---|---|---|
1001 | 4001 | 1000 | 01/11/2016 |
2001 | 4002 | 2550 | 01/11/2016 |
3001 | 5012 | 4520 | 01/11/2016 |
1001 | 6024 | 2000 | 23/01/2016 |
1001 | 6538 | 5240 | 23/01/2016 |
2001 | 7485 | 5847 | 23/01/2016 |
1515 | 4572 | 6000 | 23/01/2016 |
Al primo caricamento, l'output è:
CUSTOMER_NO | BILL_NO | LOAD_KEY | QUANTITÀ |
---|---|---|---|
1001 | 4001 | 20011 | 1000 |
2001 | 4002 | 20011 | 2550 |
3001 | 5012 | 20011 | 4520 |
Ora, al secondo caricamento, aggregherà i dati con la data della sessione successiva.
CUSTOMER_NO | BILL_NO | LOAD_KEY | QUANTITÀ | Osservazioni / operazione |
---|---|---|---|---|
1001 | 6538 | 20011 | 8240 | Il file di cache viene aggiornato dopo l'aggregazione |
2001 | 7485 | 20011 | 8397 | Il file di cache viene aggiornato dopo l'aggregazione |
3001 | 5012 | 20011 | 4520 | Nessun cambiamento |
5858 | 4566 | 20011 | 3550 | Nessun cambiamento |
1515 | 4572 | 20011 | 6000 | Nessun cambiamento |
D # 39) Cos'è una chiave surrogata?
Risposta: Una chiave surrogata è un valore intero generato in sequenza che viene utilizzato come un altro sostituto o sostituzione per la chiave primaria che è richiesta come identificazione univoca di ogni riga in una tabella.
La chiave primaria può essere cambiata frequentemente in base alle necessità, il che rende il processo di aggiornamento più difficile per un requisito futuro, la chiave surrogata è l'unica soluzione per questo problema.
D # 40) Qual è l'attività di sessione e l'attività di comando?
Risposta: L'attività di sessione è un insieme di istruzioni che devono essere applicate durante il trasferimento dei dati dall'origine alla destinazione utilizzando il comando di sessione. Il comando di sessione può essere un comando pre-sessione o un comando post-sessione.
L'attività di comando è un'attività specifica che consente l'esecuzione di uno o più comandi shell di UNIX in Windows durante il flusso di lavoro
D # 41) Qual è l'attività di comando Standalone?
Risposta: L'attività di comando standalone può essere utilizzata per eseguire il comando Shell ovunque e in qualsiasi momento nel flusso di lavoro.
Q # 42) Cos'è il flusso di lavoro? Quali sono i componenti di Workflow Manager?
Risposta: Il flusso di lavoro è il modo in cui l'attività dovrebbe essere implementata. È una raccolta di istruzioni che informano il server su come implementare l'attività.
Di seguito sono riportati i tre componenti principali di Workflow Manager:
- Task Designer
- Task Developer
- Designer del flusso di lavoro
D # 43) Cos'è l'Evento e quali sono i compiti ad esso correlati?
Risposta: L'evento può essere qualsiasi azione o funzione che si verifica nel flusso di lavoro.
Ci sono due attività ad esso correlate, che includono:
- Attività di attesa evento: Questa attività attende che si verifichi un evento, una volta che l'evento è stato attivato questa attività viene eseguita e assegna l'attività successiva.
- Attività solleva eventi: L'attività Event Raise attiva l'evento specifico nel flusso di lavoro.
Q # 44) Che cos'è un evento predefinito e un evento definito dall'utente?
Risposta: Gli eventi predefiniti sono eventi definiti dal sistema che attendono fino all'arrivo di un file specifico in una posizione specifica. Viene anche chiamato evento File-Watcher.
Gli eventi definiti dall'utente vengono creati dall'utente per aumentare in qualsiasi momento nel flusso di lavoro una volta creati.
D # 45) Che cos'è Target Designer e Target Load Order?
Risposta: Target Designer viene utilizzato per definire la destinazione dei dati.
Quando sono presenti più sorgenti o un'unica sorgente con più partizioni collegate a differenti target tramite il server INFORMATICA, allora il server utilizza Target Load Order per definire l'ordine in cui i dati devono essere caricati su una destinazione.
D # 46) Cos'è la Staging Area?
Risposta: L'area di staging è un database in cui vengono memorizzate le tabelle temporanee collegate all'area di lavoro o le tabelle dei fatti per fornire input per l'elaborazione dei dati.
Q # 47) Qual è la differenza tra STOP e ABORT?
Risposta: le differenze sono le seguenti:
- FERMARE Il comando viene eseguito sull'attività di sessione, una volta sollevato, il servizio di integrazione interrompe solo la lettura dei dati nell'origine dati ma continua l'elaborazione e la scrittura nella destinazione.
- ABORTO viene utilizzato per interrompere completamente il servizio di integrazione dalla lettura, elaborazione e scrittura dei dati sulla destinazione. Ha un proprio periodo di timeout di 60 secondi per completare l'elaborazione e la scrittura dei dati tramite il servizio di integrazione, altrimenti termina semplicemente la sessione.
D # 48) Quali sono le diverse cache di LookUp?
Risposta: La ricerca può essere memorizzata o rimossa dalla cache. Fondamentalmente, è diviso in cinque parti.
Sono:
- Cache statica
- Cache dinamica
- Recache
- Cache persistente
- Cache condivisa
La cache statica rimane così com'è senza modifiche durante l'esecuzione di una sessione.
La cache dinamica continua ad aggiornarsi frequentemente durante l'esecuzione di una sessione.
Q # 49) Come aggiornare la definizione della sorgente?
Risposta: Esistono due modi per aggiornare la definizione dell'origine.
Sono:
- È possibile modificare la definizione di origine esistente.
- Puoi importare una nuova fonte dal database.
D # 50) Come implementare le misure di sicurezza utilizzando un gestore di repository?
Risposta: Esistono 3 modi per implementare le misure di sicurezza.
Sono:
- Autorizzazione cartella all'interno di proprietari, gruppi e utenti.
- Blocco (lettura, scrittura, recupero, salvataggio ed esecuzione).
- Privilegi del repository vale a dire.
- Sfoglia repository.
- Utilizzare Workflow Manager (per creare sessioni e batch e impostarne le proprietà).
- Operatore flusso di lavoro (per eseguire sessioni e batch).
- Usa Designer, Admin Repository (consente a qualsiasi utente di creare e gestire il repository).
- Utente amministratore (consente all'utente di creare un server di repository e impostarne le proprietà).
- SuperUser (tutti i privilegi sono concessi all'utente).
D # 51) Elenca i vantaggi di INFORMATICA.
Risposta: Essendo considerato lo strumento di integrazione dei dati più apprezzato, ci sono molti vantaggi che devono essere inclusi.
Sono:
- Può comunicare in modo efficace e molto efficiente e trasformare i dati tra diverse fonti di dati come Mainframe, RDBMS, ecc.
- Di solito è molto più veloce, robusto e di facile apprendimento rispetto a qualsiasi altra piattaforma disponibile.
- Con l'aiuto di INFORMATICA Workflow Monitor, i lavori possono essere facilmente monitorati, i lavori falliti possono essere recuperati e possono essere segnalati lavori lenti.
- Ha caratteristiche come la facile elaborazione delle informazioni del database, la convalida dei dati, la migrazione di progetti da un database a un altro, lo sviluppo del progetto, l'iterazione, ecc.
D # 52) Elenca alcune aree o situazioni in tempo reale in cui è richiesta INFORMATICA.
Risposta: Data Warehousing, Data Integration, Data Migration e Application Migration da una piattaforma ad altre piattaforme sono alcuni esempi di aree di utilizzo in tempo reale.
D # 53) Spiega il programma ETL con pochi esempi.
Risposta: Conosciuto per la sua unicità, lo strumento ETL sta per Extract, Transform and Load tool che sostanzialmente risolve lo scopo di estrarre i dati e inviarli da qualche parte come definito alterandoli.
Per essere molto precisi:
- L'attività di estrazione consiste nel raccogliere i dati da fonti come database, file, ecc.
- La trasformazione è considerata come un'alterazione dei dati che sono stati ricevuti dalla fonte.
- Il caricamento definisce il processo di alimentazione dei dati modificati alla destinazione definita.
Per capire in modo tecnico, lo strumento ETL raccoglie dati da fonti eterogenee e altera per renderlo omogeneo in modo che possa essere utilizzato ulteriormente per l'analisi del compito definito.
Alcuni esempi di programmi di base includono:
- Le mappature derivano il processo ETL di lettura dei dati dalle loro origini originali in cui il processo di mappatura viene eseguito nel designer.
- I flussi di lavoro sono costituiti da più attività che vengono decise e progettate nella finestra Gestione flussi di lavoro.
- L'attività consiste in una serie di più passaggi che determinano la sequenza di azioni da eseguire durante il runtime.
D # 54) Elenca le differenze tra Database e Data Warehouse.
Risposta: Fare riferimento alla tabella seguente per comprendere le differenze tra i due:
come ottenere un indirizzo email falso
Banca dati | Data Warehouse |
---|---|
Memorizza / registra l'attuale e aggiornato che viene utilizzato nelle operazioni quotidiane | Memorizza / analizza i dati storici che vengono utilizzati per il supporto delle informazioni su una base a lungo termine. |
Il suo orientamento è sull'elaborazione transazionale in linea che include transazioni semplici e brevi. | Il suo orientamento è sull'elaborazione analitica in linea che include query complesse. |
Consiste di dati dettagliati e primitivi in cui la sua visione è relazionale piatta. | Consiste di un riepilogo di dati consolidati in cui la sua visualizzazione è multidimensionale. |
Si osserva una prestazione bassa per le query analitiche. | Le query analitiche vengono giudicate qui come ad alte prestazioni. |
L'efficienza è determinata misurando il throughput delle transazioni. | L'efficienza viene determinata misurando la velocità effettiva delle query e il tempo di risposta. |
D # 55) Spiega le caratteristiche della ricerca Connected e Unconnected.
Risposta: le funzionalità di Connected Lookup possono essere spiegate come segue:
- Esiste una fonte di input diretta dalla pipeline per la ricerca connessa.
- Ha una partecipazione attiva al flusso di dati e viene utilizzata sia la cache dinamica che quella statica.
- Memorizza nella cache tutte le colonne di ricerca e restituisce i valori predefiniti come output quando la condizione di ricerca non corrisponde.
- È possibile restituire più di una colonna valori alla porta di output.
- Vengono passati più valori di output e le porte di output sono collegate a un'altra trasformazione.
- La ricerca connessa supporta i valori predefiniti definiti dall'utente.
Le caratteristiche della ricerca non connessa possono essere spiegate come segue:
- La ricerca non connessa utilizza la cache statica e la sua fonte di input è il risultato ricevuto dall'output dell'espressione LKP.
- Memorizza nella cache solo le porte di output di ricerca e restituisce il valore come NULL quando la condizione di ricerca non corrisponde.
- Viene restituita solo una colonna da ciascuna porta.
- Un solo valore di output viene passato a un'altra trasformazione.
- I valori predefiniti definiti dall'utente non sono supportati dalla ricerca non connessa.
D # 56) Durante la sessione in esecuzione, i file di output vengono creati dal server Informatica. Arruolane alcuni.
Risposta: Di seguito sono indicati i pochi file di output:
- File cache: Questi file vengono creati al momento della creazione della cache di memoria. Per circostanze come la trasformazione della ricerca, la trasformazione dell'aggregatore, ecc., I file di indice e cache dei dati vengono creati dal server Informatica.
- File dei dettagli della sessione: Come definisce il nome, questo file contiene statistiche di carico come il nome della tabella, le righe rifiutate o scritte per ogni destinazione nella mappatura e può essere visualizzato nella finestra di monitoraggio.
- File dei dettagli delle prestazioni: Questo file è una parte della finestra delle proprietà della sessione e contiene informazioni sulle prestazioni della sessione per determinare le aree di miglioramento.
- Registro del server INFORMATICA: Il server crea un registro per tutti i messaggi di stato e di errore e può essere visualizzato nella directory principale.
- File di registro della sessione: Per ogni sessione, il server crea un file di registro della sessione a seconda del livello di traccia impostato. Le informazioni che possono essere visualizzate nei file di registro sulle sessioni possono essere:
- Processo di inizializzazione della sessione,
- Creazione di comandi SQL per thread di lettura e scrittura,
- Elenco degli errori riscontrati e
- Riepilogo carico
- Email post-sessione: Questo aiuta a comunicare automaticamente le informazioni sulla sessione (sessione completata / sessione non riuscita) ai destinatari desiderati.
- Rifiuta file: Questo file contiene informazioni sui dati che non sono stati utilizzati / scritti sulle destinazioni.
- File di controllo: Nel caso in cui, quando la sessione utilizzi il caricatore esterno, il file di controllo consiste nel caricamento delle istruzioni e del formato dei dati sul file di destinazione.
- File indicatore: Questo file contiene fondamentalmente un numero che evidenzia le righe contrassegnate per INSERT / UPDATE / DELETE o REJECT.
- File di uscita: Il file di output viene creato in base alle proprietà del file.
Q # 57) Come distinguere tra le trasformazioni Attiva e Passiva?
Risposta: Per capire la differenza tra trasformazioni attive e passive, vediamo le sue caratteristiche che spiegheranno le differenze in un modo migliore.
L'azione eseguita dalle trasformazioni attive include:
- Cambiando il numero di righe secondo il requisito, che passa attraverso le trasformazioni. Per esempio, Trasformazione del filtro che elimina la riga che non soddisfa la condizione.
- Modifica del limite della transazione impostando i punti di rollback e commit. Per esempio, Trasformazione del controllo delle transazioni.
- Modifica del tipo di riga per INSERT / UPDATE / DELETE o REJECT.
L'azione eseguita dalle trasformazioni passive include:
- Il numero di righe che passano attraverso la trasformazione non viene mai modificato.
- Il limite della transazione è impostato.
- Il tipo di riga è impostato.
D # 58) Arruola i vari tipi di trasformazioni.
Risposta: i vari tipi di trasformazioni sono i seguenti:
- Trasformazione aggregatore
- Trasformazione dell'espressione
- Trasformazione normalizzatore
- Trasformazione di rango
- Trasformazione del filtro
- Trasformazione del falegname
- Trasformazione della ricerca
- Trasformazione di stored procedure
- Ordina trasformazione
- Aggiorna la trasformazione della strategia
- Trasformazione del qualificatore di origine XML
- Trasformazione del router
- Trasformazione del generatore di sequenze
D # 59) Che cos'è la cache dinamica?
Risposta: Le ricerche INFORMATICA possono essere classificate come cache o non cache. Nel caso della cache dinamica, le righe possono essere inserite o eliminate al momento del passaggio delle righe e vengono sincronizzate con la destinazione. La memoria cache viene aggiornata ogni volta dopo le operazioni di eliminazione / aggiornamento all'interno della sessione.
D # 60) Che cos'è la decodifica nella cache statica?
Risposta: La cache statica è quella che non viene né aggiornata né aggiornata durante l'esecuzione della sessione. È la cache predefinita e restituisce il valore solo quando la condizione di restituzione è vera. In altri casi, restituisce un valore Null. In questo caso non è possibile eseguire l'inserimento o l'aggiornamento della cache.
D # 61) Menziona alcuni vantaggi della trasformazione del router rispetto alla trasformazione del filtro.
Risposta: La trasformazione del router e la trasformazione del filtro sono le stesse perché entrambe utilizzano una condizione per testare e filtrare i dati.
Tuttavia, i vantaggi del router rispetto alla trasformazione del filtro possono essere compresi dai punti menzionati di seguito.
Trasformazione del router:
- Consente più di una condizione di test.
- Fornisce la possibilità di testare gli stessi dati di input su più numeri di condizioni.
- Nel caso della mappatura, i dati di input vengono elaborati una sola volta dal server e quindi le prestazioni sono migliorate.
- Meno complesso e più efficiente.
- I record che non superano la condizione di test non vengono mai bloccati, ma vengono passati al gruppo predefinito.
D # 62) Elenca alcune proprietà delle sessioni.
Risposta: Una sessione è disponibile nel gestore del flusso di lavoro e viene configurata creando un'attività di sessione. All'interno di un programma di mappatura, possono esserci più sessioni e può essere riutilizzabile o non riutilizzabile.
Alcune delle proprietà della sessione sono le seguenti:
- Secondo il requisito, le attività di sessione possono essere eseguite contemporaneamente o in sequenza.
- È possibile configurare una sessione per analizzare le prestazioni.
- Per creare o eseguire un'attività di sessione, è necessario disporre di informazioni generali sul nome della sessione, sulla pianificazione e sul servizio di integrazione.
- Altre proprietà importanti della sessione includono il file di registro della sessione, il carico di prova, la gestione degli errori, l'intervallo di commit, le proprietà di destinazione, ecc.
D # 63) Elenca le attività per le quali viene utilizzata la trasformazione del qualificatore di origine.
Risposta: Il qualificatore di origine è considerato come una trasformazione attiva che legge le righe coinvolte nel servizio di integrazione all'interno della sessione in esecuzione. Determina il modo in cui i dati vengono recuperati dall'origine e vengono aggiunti automaticamente durante l'aggiunta di un'origine alla mappatura.
L'elenco delle diverse attività in cui viene utilizzato il qualificatore di origine è il seguente:
- Filtraggio di righe
- Ordinamento dei dati
- Creazione di query personalizzate
- Unione di tabelle dalla stessa fonte
- Selezione di valori distinti
D # 64) Citare alcune applicazioni client di Power Center con il loro scopo di base?
Risposta: Attività come la creazione di sessioni e flussi di lavoro, il monitoraggio dell'avanzamento del flusso di lavoro, la progettazione di Mapplet, ecc. Vengono eseguite dalle applicazioni client di PowerCenter.
Di seguito è riportato l'elenco delle applicazioni client di PowerCenter con il loro scopo:
- Responsabile del repository: È uno strumento di amministrazione e il suo scopo principale è gestire cartelle, oggetti, gruppi, ecc. Del repository.
- Console di amministrazione: Qui vengono eseguite le attività di servizio come avvio / arresto, backup / ripristino, aggiornamento / eliminazione, ecc.
- Progettista di power center: Il designer è costituito da vari strumenti di progettazione che servono a vari scopi. Questi strumenti di progettazione sono:
- Source Analyzer
- Target Designer
- Sviluppatore della trasformazione
- Mapplet Designer
- Responsabile della mappatura
- Responsabile del flusso di lavoro: Il suo scopo fondamentale è definire un insieme di istruzioni / flusso di lavoro necessario per eseguire le mappature progettate nel designer. Per aiutare a sviluppare un flusso di lavoro, sono disponibili 3 strumenti, vale a dire sviluppatore di attività, designer di flussi di lavoro, designer di worklet.
- Monitoraggio del flusso di lavoro: Come suggerisce il nome, il monitor del flusso di lavoro monitora il flusso di lavoro o le attività. L'elenco delle finestre disponibili sono:
- Finestra del navigatore
- Finestra di output
- Finestra temporale
- Finestra delle proprietà
- Visualizzazione attività
- Visualizzazione diagramma di Gantt
Conclusione
Spero che a questo punto tu abbia un'idea chiara dello strumento e del tipo di domande che verranno poste nelle interviste.
INFORMATICA è la migliore soluzione per eseguire la Data Integration. Funziona con la gestione multi-dati in un ambiente multipiattaforma come Windows, Linux, Unix, ecc. Ed è testato su oltre 50.000 piattaforme per risultati migliori e migliori prestazioni tra molte altre.
In poche parole, INFORMATICA è uno strumento ETL che raccoglie informazioni o dati da varie fonti e carica tali informazioni su target specifici definiti senza salvarle effettivamente. Il suo compito è fornire vari servizi e risorse a macchine diverse e quindi i dati forniti devono essere corretti con risultati notevoli.
Migliora la conoscenza dei concetti di Informatica attraverso questo articolo e preparati subito per il tuo colloquio.
Ti auguro il meglio!!!
Lettura consigliata
- Domande e risposte dell'intervista
- Domande e risposte al colloquio di prova ETL
- Alcune domande e risposte sui test manuali complicati
- Le 32 migliori domande e risposte per l'intervista di Datastage
- Principali domande e risposte dell'intervista a Teradata
- Le 30 principali domande e risposte dell'intervista SAS
- Le 24 principali domande del colloquio sulla modellazione dei dati con risposte dettagliate
- I 10 migliori strumenti di analisi dei dati per una perfetta gestione dei dati (2021 LIST)
- Funzione pool di dati in IBM Rational Quality Manager per Test Data Management
- Testare il concetto, il processo e la strategia di gestione dei dati
- I 14 MIGLIORI strumenti di gestione dei dati dei test nel 2021