top 30 sas interview questions
Zoznam najpopulárnejších často kladených otázok o rozhovoroch s odpoveďami SAS:
V tomto článku sa pozrieme na niektoré základné aj pokročilé koncepty programovania SAS prostredníctvom najčastejšie kladených otázok a odpovedí na pohovory SAS.
Systém štatistickej analýzy, všeobecne známy ako SAS, sa považuje za sadu viacerých softvérov, ktoré sú integrované a používajú sa na rôzne operácie, ako je správa údajov, prediktívna - perspektívna a deskriptívna analýza, zlepšovanie kvality, obchodná analýza, vývoj aplikácií atď.
Veľký počet prispôsobení komponentov SAS, ako aj rozsiahly prístup k programovaniu, vykonávajú úlohy analýzy údajov a transformácie údajov. Môže bežať na ľubovoľnom operačnom systéme (Linux, Windows atď.), Pretože je nezávislý na platforme.
Najpopulárnejšie otázky a odpovede týkajúce sa rozhovorov SAS
Ideme na to ..
Otázka č. 1) Zaradiť funkcie, ktoré vykonáva SAS.
Odpoveď: SAS (systém štatistickej analýzy) má svoj vlastný význam v každej obchodnej doméne.
Nižšie sú uvedené niektoré zo súhrnných funkcií, ktoré vykonáva SAS:
- Správa údajov a projektový manažment
- Skladovanie údajov
- Operačný výskum a podpora rozhodovania
- Získavanie informácií a riadenie kvality
- Obchodné plánovanie
- Štatistická analýza
Otázka 2) Aké sú 3 komponenty v programovaní SAS?
Odpoveď: 3 komponenty v programovaní SAS sú:
- Vyhlásenia
- Premenné
- Množina údajov
Otázka č. 3) Zaraďte pravidlá syntaxe, ktoré sa dodržiavajú vo príkazoch SAS.
Odpoveď: Program SAS je napísaný v okne editora. Tu obsahuje sériu príkazov, za ktorými nasleduje správna syntax, aby im program SAS porozumel.
Niektoré z pravidiel syntaxe, ktoré sa dodržiavajú v prípade komponentu Príkaz SAS, sú nasledujúce:
- Koniec ktoréhokoľvek príkazu je označený bodkočiarkou (;).
- Bodkočiarka sa používa aj na oddelenie viacerých príkazov, ktoré sa zobrazia v jednom riadku.
- Príkazy SAS nerozlišujú veľké a malé písmená a medzery pred automatickým odstránením príkazov.
- Do programu SAS pre vyhlásenia je možné zahrnúť komentáre dvoma rôznymi spôsobmi, ako napríklad:
- Riadok začínajúci hviezdičkou (*) a končiaci bodkočiarkou (;).
- Riadok začínajúci lomkou a hviezdičkou (/ *) a končiaci hviezdičkou a lomkou (* /).
Otázka č. 4) Aké sú dátové typy, ktoré obsahuje SAS?
Odpoveď: ‘Numeric’ a „Postava“ sú dva typy dátových typov, ktoré obsahuje program SAS.
Otázka č. 5) Čo sú to PDV a ich funkcie?
Odpoveď: Program Data Vector (PDV) je logický koncept a je definovaný ako oblasť pamäte, kde sadu údajov vytvára SAS.
Funkcie PDV sú nasledujúce:
- Vytvorí sa databáza s jedným pozorovaním súčasne.
- Vstupná vyrovnávacia pamäť na uchovávanie údajov z externého súboru sa vytvorí v čase kompilácie.
- PDV obsahuje dve automatické premenné, a to _N_ (zobrazuje počet dátových krokov, ktoré sa vykonávajú) a _ERROR_ (upozorňuje na chybu, ktorá sa vyskytne v čase vykonania).
Otázka 6) Čo viete o sade údajov SAS?
Odpoveď: Sada údajov SAS sa v zásade označuje ako údaje, ktoré sú k dispozícii na analýzu v rámci programu SAS. Množina údajov SAS sa označuje ako tabuľka údajov SAS.
Tabuľka údajov SAS sa skladá z dvoch častí:
- Stĺpce premenných
- Riadky pozorovaní
Užitočné informácie o množine údajov SAS možno zhrnúť takto:
- Dataset SAS dokáže čítať a má zabudované zdroje údajov na použitie ako Excel, Access atď.
- Datová sada, ktorá sa používa iba v aktuálnom behu relácie a vyhodí sa po ukončení relácie, sa nazýva Dočasná datová sada.
- Datová sada, ktorá je uložená na použitie v budúcej relácii, je tiež známa ako permanentná dátová sada.
- K tejto vstavanej množine údajov je možné pristupovať pomocou tejto cesty Knižnice -> Moje knižnice-> SASHELP.
Otázka č. 7) Vysvetlite, prečo sa vo vstupných príkazoch používa dvojitá koncová značka @@?
Odpoveď: Počas iterácie dátového kroku, vrátane dvojitého sledovania @@ vo vstupných príkazoch znamená, že SAS by mal držať aktuálny záznam na účely vykonania nasledujúceho vstupného príkazu, a nie prepínať na nový záznam.
Otázka č. 8) Vysvetlite rozdiel medzi možnosťami NODUP a NODUPKEY?
Odpoveď: Na odstránenie duplicitných hodnôt z tabuľky, PROC SORT sa v zásade delí na dve možnosti:
- NODUP
- NODUPKEY
Rozdiel medzi týmito dvoma možnosťami je možné vidieť nižšie:
NODUPKEY | NODUP |
---|---|
Porovnáva iba premennú BY, ktorá sa nachádza v množine údajov. | Porovnáva všetky premenné prítomné v množine údajov. |
Odstráni duplicitné možnosti pre hodnoty premennej uvedené v príkaze BY. | Identifikuje a eliminuje duplicitné pozorovania. |
Syntax: ÚDAJE O Triedení PROC = načítanie NODUPKEY; BY názov premennej; BEH; | Syntax: ÚDAJE O Triedení PROC = načítanie NODUP; BY názov premennej; BEH; |
Otázka č. 9) Ktorý príkaz sa používa na vykonanie triedenia v programe SAS?
Odpoveď: Príkaz PROC SORT sa používa na vykonávanie triedenia, či už na jednu alebo viac premenných. Tento príkaz sa vykoná v množine údajov, kde sa nová množina údajov vytvorí ako výsledok triedenia, ale pôvodná množina údajov sa nezmení.
Syntax:
PROC SORT DATA=original OUT=Sorted; BY variable;
Kde,
Pojem „pôvodný“ označuje pôvodný súbor údajov
Možnosť Zoradené označuje výsledok ako zoradený súbor údajov
Výraz „premenná“ označuje stĺpec, v ktorom sa vykonáva operácia triedenia.
Triedenie je možné vykonávať vzostupne aj zostupne.
Aby sa množina údajov mohla zobraziť v zostupnom poradí, používa sa vo výpise BY kľúčové slovo „zostupne“ s názvom stĺpca, v ktorom sa má triedenie vykonať.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
Otázka č. 10) Na príklade vysvetlite rozdiel medzi Informatom a formátom.
Odpoveď: Rozdiel medzi Informatom a Formatom možno vysvetliť takto:
Zistiť viac | Formát |
---|---|
Uveďte SAS, ako načítať údaje do premennej SAS. | Označte SAS, ako sa majú zobraziť hodnoty v premennej. |
Používajú sa na čítanie údajov alebo na prijímanie vstupných údajov z externých súborov. | Používajú sa na zápis údajov. |
Otázka č. 11) Rozlišujte VSTUP a INFILE.
Odpoveď: Zahrnutie príkazu INFILE do programovania SAS identifikuje externý súbor, ktorý sa skladá z údajov, zatiaľ čo zahrnutie príkazu INPUT do programovania SAS popisuje použité premenné.
Syntax pre INFILE:
INFILE ‘filename’;
Syntax pre VSTUP:
INPUT ‘varname1’ ‘varname2’;
Otázka č. 12) Vysvetlite použitie PROC tlače a PROC obsahu?
Odpoveď: Krok PROC programu SAS sa používa na vyvolanie vstavaných postupov na analýzu údajov súboru údajov.
PROC tlač: Zaisťuje správne načítanie údajov nachádzajúcich sa v množine údajov.
Obsah PROC: Zobrazí informácie o množine údajov SAS.
Otázka č. 13) Vysvetliť DATA_NULL_?
Odpoveď: Ako názov definuje, DATA_NULL_ je krok údajov, ktorý v skutočnosti nevytvára žiadnu množinu údajov.
Používa sa na:
- Vytváranie makro premenných.
- Zápis výstupu bez akejkoľvek množiny údajov.
Otázka č. 14) Ako sa znaková premenná prevádza na číselnú premennú a naopak?
Odpoveď: V rámci programovania SAS vzniká veľa úloh, pri ktorých sa má hodnota znaku previesť na číselnú hodnotu a rovnakým spôsobom sa má číselná hodnota previesť na hodnotu znaku.
PUT () sa používa na prevod číselných znakov. V takom prípade musia byť zdrojový formát a typ zdrojovej premennej vždy podobné.
Príklad:
char_var= PUT( num_var, 6.);
INPUT () sa používa na prevod znaku na numerický. V takom prípade musia byť typom zdrojovej premennej vždy znakové premenné.
Príklad:
Num_var= INPUT(char_var,2.0);
Otázka č. 15) Aký je účel _CHARACTER_ a _NUMERIC_?
Odpoveď: V aktuálnom súbore údajov
_CHARACTER_ definuje všetky znakové premenné, ktoré sú momentálne definované.
Príklad : Na zahrnutie všetkých znakových premenných do PROC MEANS sa používajú nasledujúce príkazy:
PROC MEANS; Var_character_; Run;
_NUMERIC_ definuje všetky numerické premenné, ktoré sú momentálne definované.
Príklad: Na zahrnutie všetkých číselných premenných do PROC MEANS sa používajú nasledujúce príkazy:
PROC MEANS; Var_numeric_; Run;
Otázka 16) Aké príkazy sa používajú v prípade zahrnutia alebo vylúčenia akýchkoľvek špecifických premenných v súbore údajov?
Odpoveď: Na tento účel sa používajú možnosti DROP, KEEP a množina údajov.
Premenná, ktorú chceme odstrániť z dátového kroku, je uvedená vo výpise DROP.
Premenná, ktorú si chceme ponechať z dátového kroku, je uvedená vo vyhlásení KEEP.
Otázka č. 17) Diferencovajte PROCOVÉ PROSTRIEDKY a ZHRNUTIE PROC.
Odpoveď: Rozdiel medzi PROC PROSTRIEDKAMI a ZHRNUTÍM PROCU je možné chápať nasledovne:
PROC ZNAMENÁ | ZHRNUTIE PROC |
---|---|
Tento postup štandardne vytvorí vytlačenú správu v okne VÝSTUP. | Tento postup zahŕňa PRINT vo výkaze na vytvorenie tlačenej správy. |
PROC PROSTRIEDKY štandardne berú do analýzy všetky numerické premenné. | ZHRNUTIE PROCOM vezme premenné do štatistickej analýzy, ktoré sú popísané vo výkaze VAR. |
Otázka 18) Vysvetlite účel funkcií SUBSTR v programovaní SAS.
Odpoveď: V programovaní SAS, kedykoľvek je od programu požiadavka na abstrakciu podreťazca, použije sa v prípade znakovej premennej funkcia SUBSTR.
Ak je zadaná počiatočná pozícia a dĺžka, potom sa táto funkcia použije na abstrahovanie reťazca znakov.
Syntax: SUBSTR (char_var, start, length);
Otázka č. 19) Stručne pomenujte a popíšte niekoľko znakových funkcií SAS, ktoré sa používajú na čistenie údajov.
Odpoveď: Nižšie je uvedených niekoľko funkcií znakov SAS, ktoré sa používajú na čistenie údajov:
- Komprimovať (char_string) funkcia sa používa na odstránenie medzier alebo niektorých zadaných znakov z daného reťazca.
- TRIM (str) funkcia sa používa na odstránenie koncových medzier z daného reťazca.
- LOWCASE (char_string) funkcia sa používa na prevod všetkých znakov v danom reťazci na malé písmená.
- UPCASE (char_string) funkcia sa používa na prevod všetkých znakov v danom reťazci na veľké písmená.
- COMPBL (str) funkcia sa používa na prevod viacerých polotovarov na jeden polotovar.
Otázka 20) Uveďte niekoľko spôsobov, ako sa v programovaní SAS vykonáva „tabuľkové vyhľadávanie“.
Odpoveď: V programovaní SAS môžu byť hodnoty vyhľadania tabuľky uložené nasledujúcimi spôsobmi:
- Zákonníka
- Pole
- Hašovací objekt
- Formát
- Množina údajov
Na vykonanie ‚vyhľadávania tabuľky‘ v SAS sa používajú tieto techniky:
- VÝBERY / KEDY alebo AK / POTOM výpisy
- Hodnota indexu poľa
- Hodnota kľúča hašovacieho objektu
- Príkaz FORMAT, funkcia PUT
- Zlúčiť, pripojiť sa, KĽÚČ = možnosť
Pozrime sa na príklad, ktorý ukazuje spôsob „kódu“ na vykonanie vyhľadávania tabuľky pomocou príkazov „IF / THEN“:
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
Otázka č. 21) Rozlišujte medzi funkciami CEIL a FlOOR.
Odpoveď: funkcia CEIL sa používa na skrátenie číselných hodnôt, kde zobrazuje výstup ako najmenšie celé číslo. Pod najmenším celým číslom to znamená, že celočíselná hodnota je väčšia alebo rovná argumentu.
Príklad: CEIL (12,85) zobrazí výstup ako 13.
Funkcia FLOOR sa používa na skrátenie číselných hodnôt, kde zobrazuje výstup ako najväčšie celé číslo. Pod najväčším celým číslom to znamená, že celočíselná hodnota je menšia alebo rovná argumentu.
Príklad: FLOOR (12,85) zobrazí výstup ako 12.
Otázka č. 22) Aké sú spôsoby, ako je možné vytvoriť makro premenné v programovaní SAS?
Odpoveď: Na vytváranie makro premenných v programovaní SAS možno použiť množstvo rôznych techník.
Nižšie je uvedených päť najbežnejšie používaných metód:
- Výpis% LET
- Makro parametre (pomenované aj pozičné)
- % DO vyhlásenie (iteratívne)
- DO DO PROC SQL
- CALL SYMPUTX rutina
Otázka č. 23) Vysvetlite účel vyhlásenia RETAIN.
Odpoveď: Pretože význam slova „RETAIN“ znamená zachovať pridelenú hodnotu, účel vyhlásenia RETAIN je v programovaní SAS rovnaký, ako to naznačuje.
Ak sa v rámci programu SAS vyžaduje prechod z aktuálnej iterácie na ďalší krok v dátovom kroku, príkaz RETAIN v tom čase povie SAS, aby hodnoty radšej ponechal, než aby ich nechal chýbať.
Príklad: Vytlačme program, ktorý zobrazí výstupnú hodnotu ‘z’ od 1 pomocou príkazu RETAIN.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
Otázka č. 24) Ktorý príkaz sa používa na uloženie protokolov do externého súboru?
Odpoveď: TLAČENÝ PROCES príkaz sa používa na uloženie protokolov do externého súboru.
aplikácie špehovať na inom telefóne
Príklad:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
Otázka č. 25) Uveďte niektoré bežné chyby, ktoré sa zvyčajne vyskytujú v programovaní SAS.
Odpoveď: Nižšie sú uvedené niektoré bežné chyby, ktoré sa zvyčajne vyskytujú, najmä ak ste v tomto programovacom jazyku nováčikom.
- Základná syntax obsahuje na konci každého príkazu bodkočiarku a chýbajúci bodkočiarka je najbežnejšou chybou.
- Po odoslaní programu kontrolu preskočíte.
- Chyby komentárov, ako napríklad nepoužívanie komentárov tam, kde je to potrebné, alebo použitie komentárov nevhodným spôsobom.
- Nepoužívajú sa správne metódy ladenia.
Otázka č. 26) Uveďte možnosti systému SAS na ladenie makier SAS.
Odpoveď: Na uľahčenie sledovania kódu makra, ako aj kódu SAS generovaného makrami, možno použiť niektoré možnosti systému.
Oni sú:
- MLOGICKÉ
- MPRINT
- SYMBOLY
Správu, ktorá bude vygenerovaná týmito systémovými možnosťami, nájdete v protokole SAS.
Otázka č. 27) Rozlišujte medzi funkciami SAS a postupmi SAS.
Odpoveď: Hlavné rozdiely možno zistiť / pochopiť podľa prípadu vysvetleného tak pre funkcie SAS, ako aj pre postupy.
Prípad:
Pre Funkcia , hodnota argumentu sa dodáva alebo hovorí pre výpočet v rámci pozorovania uvedeného v programovom vyhlásení, zatiaľ čo v prípade Postup , očakáva sa, že každé pozorovanie bude mať iba jednu premennú, cez ktorú sa vykonáva výpočet, ako je uvedené v nasledujúcom príklade.
Poďme to pochopiť na príkladoch:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
Tu vo vyššie uvedených príkladoch sa argumenty odovzdané strednej funkcii berú na výpočet ako pozorovanie.
proc sort; by month; run; proc means; by month; var avgtemp; run;
Tu vo vyššie uvedenom príklade Proc znamená, že funkcia počíta priemernú teplotu pre jeden argument, ktorý sa odovzdá ako pozorovanie, tj. Po mesiaci.
Otázka č. 28) Čo viete o programoch SYMPUT a SYMGET?
Odpoveď: Hlavné rozdiely medzi nimi sú uvedené nižšie.
SYMPUT sa používa na ukladanie hodnoty množiny údajov do premennej makra, zatiaľ čo SYMGET sa používa na načítanie hodnoty z premennej makra do množiny údajov.
Otázka č. 29) Vysvetlite špeciálne oddeľovače vstupu používané v programovaní SAS.
Odpoveď: Špeciálne oddeľovače vstupu používané v programovaní SAS sú:
- DLM
- DSD
Používajú sa vo výroku „INFILE“ a funkcia DSD ignoruje oddeľovače, ktoré sú uvedené v úvodzovkách.
Otázka 30) Ktorá funkcia sa používa na spočítanie počtu intervalov medzi dvoma dátumami SAS?
Odpoveď: Intervalová funkcia INTCK sa používa na spočítanie počtu intervalov medzi dvoma danými dátumami SAS.
Syntax:
INTCK(interval,start-of-period,end-of-period)
Záver
Doteraz sme videli niekoľko otázok a odpovedí, ktoré by vám poskytli jasné pochopenie koncepcií programovania SAS, ako aj predstavu o podstate otázok kladených v rozhovoroch SAS.
Pokiaľ ste v programovaní SAS nováčikom, znalosti niektorých technológií počítačového programovania a znalosti jazyka SQL (Structured Query Language) vám prinesú ďalšiu výhodu v porozumení a rýchlom učení sa v systéme SAS.
Dúfam, že ste pripravení sebavedome čeliť akýmkoľvek pohovorom SAS !!