top 30 sas interview questions
Elenco delle domande di intervista SAS più popolari con risposte:
In questo articolo, daremo uno sguardo ad alcuni dei concetti di base e avanzati della programmazione SAS attraverso le domande e le risposte delle interviste SAS più frequenti.
Il sistema di analisi statistica, comunemente noto come SAS, è considerato come un insieme di più software integrato e utilizzato per varie operazioni come gestione dei dati, analisi predittiva e descrittiva, miglioramento della qualità, analisi aziendale, sviluppo di applicazioni, ecc.
L'elevato numero di personalizzazioni dei componenti di SAS, nonché l'ampia funzionalità di approccio alla programmazione insieme, eseguono attività di analisi e trasformazione dei dati. Può essere eseguito su qualsiasi sistema operativo (Linux, Windows, ecc.) Poiché è indipendente dalla piattaforma.
Domande e risposte dell'intervista SAS più popolari
Eccoci qui..
D # 1) Elenca le funzioni svolte da SAS.
Risposta: SAS (Statistical Analysis System) ha la sua importanza in ogni dominio aziendale.
Di seguito sono elencate alcune delle funzioni riassunte che vengono eseguite da SAS:
- Gestione dei dati e gestione dei progetti
- Data Warehousing
- Ricerca operativa e supporto decisionale
- Recupero delle informazioni e gestione della qualità
- Pianificazione aziendale
- Analisi statistica
D # 2) Quali sono i 3 componenti nella programmazione SAS?
Risposta: I 3 componenti nella programmazione SAS sono:
- Dichiarazioni
- Variabili
- Set di dati
D # 3) Elenca le regole di sintassi seguite nelle istruzioni SAS.
Risposta: Il programma SAS è scritto nella finestra dell'editor. Qui, contiene una serie di istruzioni seguite dalla sintassi corretta in modo che il programma SAS possa comprenderla.
Alcune delle regole di sintassi che vengono seguite nel caso del componente Statement di SAS sono le seguenti:
- La fine di ogni istruzione è contrassegnata da un punto e virgola (;).
- Un punto e virgola viene utilizzato anche per separare più istruzioni visualizzate su una singola riga.
- Le istruzioni SAS non fanno distinzione tra maiuscole e minuscole e la spaziatura aggiuntiva prima che le istruzioni vengano rimosse automaticamente.
- I commenti possono essere inclusi nel programma SAS per le istruzioni in due modi diversi come:
- Una riga che inizia con un asterisco (*) e termina con un punto e virgola (;).
- Una riga che inizia con una barra di inoltro e un asterisco (/ *) e termina con un asterisco e una barra (* /).
D # 4) Quali sono i tipi di dati contenuti in SAS?
Risposta: 'Numerico' e 'Personaggio' sono i due tipi di dati contenuti nel programma SAS.
D # 5) Cosa sono i PDV e le loro funzioni?
Risposta: Program Data Vector (PDV) è un concetto logico ed è definito come un'area di memoria in cui un set di dati viene costruito da SAS.
Le funzioni di PDV sono le seguenti:
- Viene creato un database con un'osservazione alla volta.
- Il buffer di input per contenere i dati da un file esterno viene creato al momento della compilazione.
- PDV contiene due variabili automatiche, ovvero _N_ (visualizza il conteggio del passo dati che viene eseguito) e _ERROR_ (notifica l'errore che si verifica al momento dell'esecuzione).
D # 6) Cosa sai del set di dati SAS?
Risposta: Il set di dati SAS è fondamentalmente indicato come i dati disponibili per l'analisi all'interno di un programma SAS. Il set di dati SAS è anche denominato tabella dati SAS.
La tabella dati SAS è composta da due parti:
- Colonne di variabili
- Righe di osservazioni
Informazioni utili sul data set SAS possono essere riassunte come segue:
- SAS Dataset è in grado di leggere e dispone di origini dati integrate da utilizzare come Excel, Access, ecc.
- Il set di dati utilizzato solo nella sessione corrente eseguita e scartato al termine della sessione è noto come set di dati temporaneo.
- Il set di dati archiviato per essere utilizzato nella sessione futura è anche noto come set di dati permanente.
- È possibile accedere al set di dati integrato utilizzando questo percorso Biblioteche -> Le mie biblioteche-> SASHELP.
D # 7) Spiega perché il doppio trailing @@ viene utilizzato nelle istruzioni di input?
Risposta: Durante l'iterazione del passaggio dati, l'inclusione del doppio trailing @@ nelle istruzioni Input implica che SAS debba conservare il record corrente ai fini dell'esecuzione dell'istruzione Input successiva piuttosto che passare al nuovo record.
D # 8) Spiega la differenza tra le opzioni NODUP e NODUPKEY?
Risposta: Per rimuovere i valori duplicati dalla tabella, PROC SORT è sostanzialmente classificato tra due opzioni:
- NODUP
- NODUPKEY
La differenza tra queste due opzioni può essere vista di seguito:
NODUPKEY | NODUP |
---|---|
Confronta solo la variabile BY presente nel set di dati. | Confronta tutte le variabili presenti nel dataset. |
Rimuove le opzioni duplicate per i valori della variabile elencata nell'istruzione BY. | Identifica ed elimina le osservazioni duplicate. |
Sintassi: PROC SORT DATA = readin NODUPKEY; PER nome variabile; CORRERE; | Sintassi: PROC SORT DATA = readin NODUP; PER nome variabile; CORRERE; |
D # 9) Quale comando viene utilizzato per eseguire l'ordinamento nel programma SAS?
Risposta: Il comando PROC SORT viene utilizzato per eseguire l'ordinamento, sia su una singola variabile che su più variabili. Questo comando viene eseguito sul set di dati in cui viene creato il nuovo set di dati come risultato dell'ordinamento ma il set di dati originale rimane invariato.
Sintassi:
PROC SORT DATA=original OUT=Sorted; BY variable;
Dove,
'Originale' si riferisce al set di dati originale
'Ordinato' si riferisce al risultato come set di dati ordinato
'Variabile' si riferisce alla colonna su cui viene eseguita l'operazione di ordinamento.
L'ordinamento può essere effettuato sia in ordine crescente che decrescente.
Affinché il set di dati venga visualizzato in ordine decrescente, la parola chiave 'Descending' viene utilizzata nell'istruzione BY con il nome della colonna su cui deve essere eseguito l'ordinamento.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
D # 10) Spiega la differenza tra Informat e Format con un esempio.
Risposta: La differenza tra Informat e Format può essere spiegata come:
Scopri di più | Formato |
---|---|
Indicare a SAS come leggere i dati nella variabile SAS. | Indicare a SAS come visualizzare i valori nella variabile. |
Questi sono usati per leggere i dati o prendere i dati di input da file esterni. | Questi sono usati per scrivere i dati. |
D # 11) Differenziare INPUT e INFILE.
Risposta: L'inclusione di un'istruzione INFILE all'interno della programmazione SAS identifica un file esterno costituito dai dati, mentre l'inclusione dell'istruzione INPUT nella programmazione SAS descrive le variabili utilizzate.
La sintassi per INFILE:
INFILE ‘filename’;
La sintassi per INPUT:
INPUT ‘varname1’ ‘varname2’;
D # 12) Spiega l'uso della stampa PROC e dei contenuti PROC?
Risposta: La fase PROC del programma SAS viene utilizzata per richiamare procedure integrate per analizzare i dati del set di dati.
Stampa PROC: Assicura che i dati presenti nel dataset vengano letti correttamente.
Contenuti PROC: Visualizza le informazioni sul set di dati SAS.
D # 13) Spiega DATA_NULL_?
Risposta: Come definisce il nome, DATA_NULL_ è un passaggio dati che in realtà non crea alcun set di dati.
È usato per:
- Creazione di variabili macro.
- Scrittura dell'output senza alcun set di dati.
Q # 14) Come viene convertita la variabile carattere in una variabile numerica e viceversa?
Risposta: Nella programmazione SAS, sorgono molte attività in cui un valore di carattere deve essere convertito in numerico e, allo stesso modo, un valore numerico deve essere convertito in un valore di carattere.
METTERE() viene utilizzato per convertire un valore numerico in carattere. In questo caso, il formato sorgente e il tipo di variabile sorgente devono essere sempre simili.
Esempio:
char_var= PUT( num_var, 6.);
INPUT () viene utilizzato per convertire un carattere in numerico. In questo caso, il tipo di variabile sorgente deve essere sempre variabili carattere.
Esempio:
Num_var= INPUT(char_var,2.0);
D # 15) Qual è lo scopo di _CHARACTER_ e _NUMERIC_?
Risposta: Nel set di dati corrente,
_PERSONAGGIO_ definisce tutte le variabili carattere attualmente definite.
Esempio : Per includere tutte le variabili carattere in PROC MEANS, vengono utilizzate le seguenti istruzioni:
PROC MEANS; Var_character_; Run;
_NUMERICO_ definisce tutte le variabili numeriche attualmente definite.
Esempio: Per includere tutte le variabili numeriche in PROC MEANS, vengono utilizzate le seguenti istruzioni:
PROC MEANS; Var_numeric_; Run;
D # 16) Quali comandi vengono utilizzati nel caso di includere o escludere variabili specifiche nel set di dati?
Risposta: A tale scopo vengono utilizzate le opzioni DROP, KEEP e data set.
La variabile che vogliamo rimuovere dal passaggio dati è specificata nell'istruzione DROP.
La variabile che vogliamo conservare dal passaggio dati è specificata nell'istruzione KEEP.
D # 17) Differenziare tra PROC MEANS e PROC SUMMARY.
Risposta: La differenza tra PROC MEANS e PROC SUMMARY può essere intesa come segue:
PROC MEZZI | SOMMARIO PROC |
---|---|
Questa procedura produce il report stampato per impostazione predefinita nella finestra OUTPUT. | Questa procedura include il PRINT nell'istruzione per produrre il report stampato. |
PROC MEANS per impostazione predefinita prende tutte le variabili numeriche nell'analisi. | PROC SUMMARY prende le variabili nell'analisi statistica che sono descritte nell'istruzione VAR. |
D # 18) Spiegare lo scopo delle funzioni SUBSTR nella programmazione SAS.
Risposta: Nella programmazione SAS, ogni volta che è richiesto al programma di astrarre una sottostringa, la funzione SUBSTR viene utilizzata nel caso di una variabile carattere.
Quando vengono specificate una posizione iniziale e una lunghezza, questa funzione viene utilizzata per astrarre la stringa di caratteri.
Sintassi: SUBSTR (char_var, start, length);
D # 19) Assegna un nome e descrivi in breve alcune funzioni dei caratteri SAS utilizzate per la pulizia dei dati.
Risposta: Di seguito sono elencate poche funzioni di caratteri SAS utilizzate per la pulizia dei dati:
- Comprimi (char_string) viene utilizzata per rimuovere spazi o alcuni caratteri specificati da una determinata stringa.
- TRIM (str) viene utilizzata per rimuovere gli spazi finali da una determinata stringa.
- LOWCASE (char_string) è usata per convertire tutti i caratteri in una data stringa in minuscolo.
- UPCASE (char_string) viene utilizzata per convertire in maiuscolo tutti i caratteri di una data stringa.
- COMPBL (str) viene utilizzata per convertire più spazi in un singolo spazio.
D # 20) Menziona alcuni modi con cui viene eseguita una 'ricerca nella tabella' nella programmazione SAS.
Risposta: Nella programmazione SAS, i valori di ricerca della tabella possono essere memorizzati nei seguenti modi:
- Codice
- Vettore
- Oggetto hash
- Formato
- Set di dati
Le seguenti tecniche vengono utilizzate per eseguire la 'ricerca in tabella' rispettivamente in SAS:
- Istruzioni SELECT / WHEN o IF / THEN
- Valore dell'indice di matrice
- Valore della chiave dell'oggetto hash
- Istruzione FORMAT, funzione PUT
- Unisci, unisci, KEY = Opzione
Vediamo un esempio che mostra il modo 'Codice' per eseguire la ricerca nella tabella utilizzando le istruzioni 'IF / THEN':
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
D # 21) Differenziare tra le funzioni CEIL e FLOOR.
Risposta: funzione CEIL viene utilizzato per troncare i valori numerici in cui visualizza l'output come numero intero più piccolo. Per numero intero più piccolo, qui significa che il valore intero è maggiore / uguale all'argomento.
Esempio: CEIL (12.85) visualizzerà l'output come 13.
Funzione FLOOR viene utilizzato per troncare i valori numerici in cui visualizza l'output come numero intero più grande. Per numero intero più grande, qui significa che il valore intero è minore / uguale all'argomento.
Esempio: FLOOR (12.85) visualizzerà l'output come 12.
D # 22) Quali sono i modi in cui è possibile creare variabili macro nella programmazione SAS?
Risposta: Ebbene, è possibile utilizzare una serie di tecniche diverse per creare variabili macro nella programmazione SAS.
Di seguito sono elencati i cinque metodi più comunemente usati:
- Dichiarazione% LET
- Parametri macro (denominati oltre che posizionali)
- Dichiarazione% DO (iterativo)
- INTO in PROC SQL
- CHIAMATA SYMPUTX routine
D # 23) Spiegare lo scopo della dichiarazione RETAIN.
Risposta: Poiché il significato della parola 'RETAIN' significa mantenere il valore una volta assegnato, lo scopo dell'istruzione RETAIN è lo stesso nella programmazione SAS come implica il significato.
All'interno di un programma SAS, quando è necessario passare dall'iterazione corrente alla fase successiva dei dati, in quel momento l'istruzione RETAIN dice a SAS di mantenere i valori invece di impostarli come mancanti.
Esempio: Stampiamo un programma che mostrerà il valore di output di 'z' a partire da 1 utilizzando l'istruzione RETAIN.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
D # 24) Quale comando viene utilizzato per salvare i log nel file esterno?
Risposta: PROCESSO STAMPATO viene utilizzato per salvare i registri nel file esterno.
strumenti di test cross browser open source
Esempio:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
D # 25) Menziona alcuni errori comuni che di solito vengono commessi nella programmazione SAS.
Risposta: Di seguito sono elencati alcuni degli errori comuni che di solito vengono commessi soprattutto quando si è nuovi a questo linguaggio di programmazione.
- La sintassi di base include un punto e virgola alla fine di ogni istruzione e la mancanza di un punto e virgola è l'errore più comune.
- Si salta il controllo dei log dopo aver inviato il programma.
- Commentare errori come il mancato utilizzo dei commenti ove necessario o l'utilizzo dei commenti in modo inappropriato.
- Non utilizzare metodi di debug adeguati.
D # 26) Menzionare le opzioni di sistema SAS per eseguire il debug delle macro SAS.
Risposta: Per aiutare a tenere traccia del codice della macro e del codice SAS generato dalle macro, è possibile utilizzare alcune opzioni di sistema.
Sono:
- MLOGIC
- MPRINT
- SIMBOLI
Il messaggio che verrà generato da queste opzioni di sistema può essere visualizzato nel registro SAS.
D # 27) Distinguere tra funzioni SAS e procedure SAS.
Risposta: Le principali differenze possono essere scoperte / comprese dal caso spiegato sia per le funzioni SAS che per le procedure.
Astuccio:
Per Funzione , il valore dell'argomento viene fornito o, ad esempio, preso per il calcolo attraverso l'osservazione menzionata nell'istruzione del programma mentre, nel caso di Procedura , ogni osservazione dovrebbe avere una sola variabile attraverso la quale viene eseguito il calcolo come indicato nell'esempio seguente.
Cerchiamo di capirlo con esempi:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
Negli esempi precedenti, gli argomenti passati alla funzione di media vengono presi per il calcolo come un'osservazione.
proc sort; by month; run; proc means; by month; var avgtemp; run;
Nell'esempio sopra, Proc significa che la funzione calcola la temperatura media per un argomento passato come osservazione, cioè per mese.
D # 28) Cosa sai di SYMPUT e SYMGET?
Risposta: Le principali differenze tra i due sono menzionate di seguito.
SYMPUT viene utilizzato per memorizzare il valore di un set di dati nella variabile macro mentre SYMGET viene utilizzato per recuperare il valore dalla variabile macro al set di dati.
D # 29) Spiegare gli speciali delimitatori di input utilizzati nella programmazione SAS.
Risposta: I delimitatori di input speciali utilizzati nella programmazione SAS sono:
- DLM
- DSD
Sono utilizzati nell'istruzione 'INFILE' e DSD ha la funzionalità di ignorare i delimitatori che appaiono racchiusi tra virgolette.
D # 30) Quale funzione viene utilizzata per contare il numero di intervalli tra due date SAS?
Risposta: La funzione intervallo INTCK viene utilizzata per contare il numero di intervalli tra due date SAS specificate.
Sintassi:
INTCK(interval,start-of-period,end-of-period)
Conclusione
Finora, abbiamo visto più domande e risposte che ti avrebbero fornito una chiara comprensione dei concetti di programmazione SAS, oltre a darti un'idea della natura delle domande poste nelle interviste SAS.
Bene, se sei nuovo nella programmazione SAS, la conoscenza di alcune tecnologie di programmazione informatica e familiarità con SQL (Structured Query Language) sarà un ulteriore vantaggio per te per la comprensione e l'apprendimento rapido di SAS.
Spero che tu sia pronto ad affrontare con fiducia qualsiasi colloquio SAS !!